
[데이터넷] 김지완 사이냅소프트 본부장 “AI 성능, 문서 원본 분석 기술에 달렸다”
안녕하세요. Document AI 기업 사이냅소프트입니다.
최근 사이냅소프트의 문서 처리 기술과 AI 어시스턴트가
전자문서·AI 융합 트렌드와 함께 언론 보도에 소개되었습니다.
기사에서는 도큐애널라이저가 복잡한 표나 다단 구조까지 정확히 인식해
LLM 학습을 위한 고품질 데이터를 만들어낸다는 점,
그리고 사이냅 어시스턴트가 Agentic RAG 기반으로
신뢰도 높은 답변과 정확한 출처를 제공한다는 점을 중심으로
사이냅소프트 기술의 강점을 소개하고 있습니다.
문서를 진짜 자산으로 바꾸는 기술, 아래 기사에서 확인해보세요!
▼ 아래 기사에서 자세한 내용을 확인해 보세요. 😊
**********************
문서 처리 기술력 고도화로 복잡한 표·다단 구조까지 정확히 인식
단순 페이퍼리스 넘어 기업의 지식 자산화 경쟁력 확보
========================================================
[데이터넷] 최근 전자문서 시장은 생성형 AI와 만나 거대한 전환점을 맞고 있다. 단순한 페이퍼리스를 넘어, 기업의 비정형 데이터를 지식 자산으로 바꾸는 ‘도큐먼트 AI’가 핵심 경쟁력으로 부상했다. 이러한 흐름 속에서 국내 대표 문서 처리 솔루션 기업 사이냅소프트가 AI 기술을 결합한 혁신적인 솔루션을 선보이며 시장의 주목을 받고 있다.
김지완 사이냅소프트 AI사업본부장은 “모든 AI 기술의 시작은 결국 문서에서 출발한다”며 “문서의 원본(Native)을 PDF 변환 없이 직접 분석해 구조적 의미를 완벽하게 추출하는 기술력이 곧 AI의 성능을 좌우한다”고 강조했다.
“HWP·오피스 원본 그대로 분석 ··· RAG 품질 극대화”
과거의 전자문서가 단순히 종이를 디지털로 옮겨 저장하고 검색하는 데 그쳤다면, 이제 AI 기술은 문서의 ‘의미’와 ‘구조’를 이해하고 스스로 판단해 사용자의 의사결정을 돕는 ‘지능형 비서’로 진화하고 있다.
AI가 문서에 담긴 진정한 가치를 끌어내기 위해서는 표 안의 표, 다단 편집처럼 복잡한 문서 구조까지 정확히 이해하는 것이 핵심이다. 사이냅소프트는 지난 25년간 쌓아온 독보적인 문서 처리 기술력을 바탕으로 도큐먼트 AI의 새로운 기준을 제시하고 있다.
사이냅소프트의 핵심 경쟁력은 ‘사이냅 도큐애널라이저’에서 나온다. 이 솔루션은 아래아한글(HWP), MS오피스 등 다양한 포맷의 문서를 PDF로 변환하는 중간 과정 없이 원본 파일 그대로 분석한다.
김 본부장은 “PDF는 문서를 화면에 그리기 위한 정보만 담고 있어, 다단 편집이나 복잡한 표의 읽기 순서 등 원본의 구조적 정보가 유실되기 쉽다”며 “잘못된 순서로 텍스트를 추출해 벡터DB에 저장하면 검색증강생성(RAG) 시스템은 완전히 잘못된 답변을 내놓을 수밖에 없다”고 지적했다.
‘사이냅 도큐애널라이저’는 ‘표 안의 표’, ‘다단’, ‘장/절/조’ 등 국내 공공·금융기관 문서의 독특하고 복잡한 구조까지 정확히 인식한다. 제목, 본문, 캡션 등을 구분해 의미 단위로 정보를 추출하고, 표나 차트 안의 데이터까지 원본 그대로 꺼내 LLM(거대언어모델)이 학습하기 좋은 고품질 데이터로 정제한다. 이는 LLM의 할루시네이션(환각) 현상을 최소화하고, 답변의 정확도를 높이는 결정적인 역할을 한다.
에이전틱 RAG로 신뢰성 확보 ··· “근거까지 정확히 제시”
AI 도입을 망설이는 가장 큰 이유는 ‘신뢰성’이다. 사이냅소프트는 이 문제를 해결하기 위해 ‘사이냅 어시스턴트’에 ‘에이전틱 RAG(Agentic RAG)’ 기술을 적용했다.
김 본부장은 “하나의 LLM이 모든 것을 처리하는 대신, 여러 전문 AI 에이전트가 협력해 질문 의도를 분석하고, 최적의 정보를 찾아내 답변을 생성하는 방식”이라며 “예를 들어 기업 정보를 분석할 때 재무 에이전트, 주가 에이전트, 평판 에이전트가 각자 역할을 수행한 뒤 결과를 종합해 가장 신뢰도 높은 답변을 만든다”고 설명했다.
특히 ‘사이냅 어시스턴트’는 답변의 근거가 된 원문 출처를 페이지뿐만 아니라 특정 문단이나 표까지 정확히 짚어 제시한다. 사용자는 AI의 답변을 직접 검증하며 신뢰할 수 있다. 모든 솔루션은 고객사 내부망에 직접 설치하는 온프레미스 방식을 지원해 민감한 데이터의 외부 유출 걱정도 없다.
이러한 기술력은 금융감독원 공시 데이터를 분석해 제공하는 ‘다트포인트 AI’ 서비스에 그대로 적용됐다. 일반 투자자들이 접근하기 어려웠던 방대한 공시 보고서를 AI가 분석해 주고, 자연어 질의응답을 통해 기업 정보를 쉽게 파악하도록 돕는다. 보고서 안의 표를 엑셀로 변환해 주는 기능은 사용자들에게 특히 좋은 반응을 얻고 있다.
문서 생성부터 활용까지 ··· ‘AI 풀스택’ 제공
사이냅소프트는 문서 분석뿐만 아니라 생성, 편집, 활용에 이르는 전 과정에 AI를 접목했다. ▲AI가 설문지를 자동 생성하는 ‘사이냅 폼’ ▲AI로 문서 초안을 작성하고 요약하는 ‘사이냅 에디터’ ▲이미지 속 텍스트와 데이터를 추출해 로봇업무자동화(RPA)와 연계하는 ‘사이냅 OCR’ 등 통합적인 솔루션 라인업을 갖췄다.
김 본부장은 “국내 최다인 150개 이상의 레퍼런스를 보유한 AI OCR 기술은 RPA 시스템의 필수 요소로 자리 잡았다”며 “과거에는 사람이 수기로 입력하던 건강보험 영수증, 고지서 등의 데이터를 AI가 자동으로 처리해 업무 효율을 극대화한다”고 말했다.
그는 이어 “단기적으로는 텍스트와 비전 AI 기술을 고도화하고, 장기적으로는 음성을 다루는 보이스 AI(Voice AI), 나아가 로봇의 ‘두뇌’ 역할을 하는 소프트웨어 개발까지 염두에 두고 있다”며 “문서가 모든 업무의 중심에 있는 한 도큐먼트 AI는 계속해서 발전할 것이며, 사이냅소프트는 그 변화의 중심에서 기업의 가장 든든한 AI 혁신 파트너가 될 것”이라고 밝혔다.
기사 원문 보기