기사등록 : 2023-06-19 10:09
[서울=뉴스핌] 이지용 기자 = LG AI 연구원이 세계 최대 컴퓨터 비전 학회에서 이미지 캡션과 키워드를 생성하는 '캡셔닝 인공지능(AI)'을 공개했다고 19일 밝혔다.
LG AI 연구원은 최근 캐나다 벤쿠버에서 열리고 있는 세계 최대 컴퓨터 비전 학회 'CVPR 2023'에서 생성형 AI 상용화 서비스인 캡셔닝 AI의 '제로샷 이미지 캡셔닝' 기술 등을 선보였다. 캡셔닝 AI는 인간처럼 처음 보는 이미지까지 자연어로 설명할 수 있는 AI로 이미지 검색에 활용할 수 있는 정보인 문장이나 키워드 등 메타 데이터를 생성한다. 제로샷 이미지 캡셔닝은 AI가 기존에 학습한 대량의 이미지와 텍스트 데이터를 기반으로 배경과 인물 등 이미지의 다양한 요소를 인식하고 관계를 설명할 수 있게 하는 기술이다.
LG AI 연구원은 이번 학회 기간 중 LG 부스를 방문한 연구자들을 대상으로 캡셔닝 AI 서비스를 시연할 예정이다.
앞서 LG AI 연구원은 캡셔닝 AI 개발을 위해 이미지 등 콘텐츠가 매일 수십만 개 이상 추가되는 세계 최대 플랫폼 기업인 셔터스톡과 협업을 해왔다.
leeiy5222@newspim.com