[서울=뉴스핌] 양태훈 기자 = 업스테이지는 지난 21일 국제패턴인식협회인 'IAPR'이 시작한 국제 경진 대회인 'ICDAR 로버스트 리딩 컴페티션'에서 4개 부문을 석권했다고 밝혔다.
ICDAR 로버스트 리딩 컴페티션은 디지털 이미지와 비디오 상에서 텍스트를 감지·인식하는 기술인 Robust Reading 분야에서 가장 권위 있는 국제경진대회다.
업스테이지는 HierText-1/2, VQAonBD, IHTR 4종목에서 모두 1위를 기록하며 글로벌 최고 OCR 기술력을 다시 한 번 입증했다.
IHTR 순위. [사진=업스테이지] |
OCR(Optical Character Recognition)은 크게 이미지에서 문자의 위치를 찾는 '검출 기술'과 문자가 무엇인지 알아내는 '인식 기술'로 나뉜다. 업스테이지는 문자 검출 기술과 인식기술 모두에서 아마존, 엔비디아, 알리바바, 화웨이 등 글로벌 빅테크 기업들과의 경쟁에서 가장 높은 점수를 기록했다.
IHTR 종목은 인도에서 쓰이는 대표 10종의 언어에 대한 글자 인식 문제를 다룬다. 업스테이지는 글자 인식 기술을 활용하여 최고 성능의 모델을 구축하는 성과를 보여주었다.
특히 단어, 줄 및 단락의 구조를 나타내는 계층적 주석을 제공하는 첫 번째 실제 이미지 데이터셋인 'HierText'를 사용, OCR의 새로운 작업을 수행하는 'Hierarchical Text Detection and Recognition' 종목에서는 업스테이지 팀과 홍콩지사가 1위와 2위를 모두 휩쓸었다.
단순 OCR기술만으로 좋은 평가를 받을 수 없는 VQAonBD 종목에서도 업스테이지는 두각을 나타냈다. VQAonBD는 문서 이미지를 주고 이미지 내 데이터의 답을 얻는 과제를 수행하는 종목이다.
업스테이지 팀은 국내 유일의 캐글 대회 두 자리 수 금메달에 빛나는 업스테이지 챌린지스 팀과 OCR팀이 의기투합해 구성했다. 2021년과 2022년 연속으로 캐글 대회에서 세계 1위와 2위를 기록하며 국내 최연소 그랜드마스터에 이름을 올린 김윤수 엔지니어를 포함, 두명의 그랜드마스터와 한명의 마스터를 보유한 챌린지스 팀의 역량과 현업에서 실제 다양한 기업의 OCR 과제를 수행 하고 있는 업스테이지의 연구원들이 힘을 합쳐 최고의 성과를 만들어 냈다는 평가다.
AI OCR 기술은 AI 기술 중에서도 디지털 전환의 기반이 되는 기술로 데이터의 디지털 자산화를 위한 고도화에 여러 기업들이 속도를 내고 있다. 업스테이지는 최고의 OCR 기술을 활용한 OCR팩을 개발, 올 초 한화생명과 삼성SDS, 포스코그룹 등 다양한 산업의 기업의 AI 혁신에 앞장서고 있다.
업스테이지는 이번 대회에서 기술력을 재확인한 OCR기술을 비롯, 고객 정보와 제품 및 서비스 특징을 고려한 추천 기술 등 AI 기술을 고객들이 한 번에 맞춤형으로 활용 할 수 있도록 돕는 노코드-로코드 솔루션 AI팩과 이를 코드 복사만으로 편리하게 활용할 수 있는 API 시리즈를 출시, 고객사들의 AI 혁신을 돕고 있다. 업스테이지 AI팩을 이용하면 데이터 가공, AI 모델링, 지표 관리를 쉽게 활용할 수 있을 뿐 아니라 지속적인 업데이트를 지원, 상시 최신화 된 AI 기술을 편리하게 사용할 수 있다.
김성훈 업스테이지 대표는 "세계최고의 기술력이 검증된 업스테이지의 AI OCR로 문서 자동화가 필요한 전 산업의 디지털 전환과 AI 글로벌 혁신을 도울 것"이라고 전했다.
dconnect@newspim.com