포트폴리오
AI Agent
AI OCR 텍스트 추출
스캔 문서·이미지를 AI가 분석하여 텍스트를 자동 추출하고, 검색 가능한 디지털 문서로 변환
PythonGemini Vision APIOpenClawPDF Processing
Challenge
종이 문서, 스캔 파일, 사진 속 텍스트를 AI 비전 모델이 자동으로 인식·추출하는 기능입니다.
Solution
추출된 텍스트는 구조화된 형태로 정리되어, 검색·편집·후속 업무 자동화에 바로 활용할 수 있습니다.
Before
문서당 10분
After AX
10초
Features
핵심 기능
AI 비전 기반 텍스트 인식
기울어진 문서, 손글씨, 복잡한 표 등 기존 OCR이 놓치는 영역까지 AI가 정확하게 인식합니다.
다국어 자동 인식
한국어, 영어, 일본어, 중국어 등 다국어 문서를 별도 설정 없이 자동 인식합니다.
레이아웃 보존 추출
표, 목록, 단락 구분 등 원본 문서의 구조를 유지한 채 텍스트를 추출합니다.
대량 배치 처리
수백 장의 문서를 폴더에 넣으면 자동으로 순차 처리하여 결과물을 일괄 생성합니다.
Results
프로젝트 성과
문서당 10분 → 10초로 98% 단축
수작업 데이터 입력 시간
AI 비전 모델 기반 인식률 99% 이상 (인쇄 문서 기준)
다국어 문서 추가 비용 제로 — 언어별 엔진 불필요
폴더 감시 연동으로 완전 무인 자동화 운영 가능