# AI OCR 텍스트 추출

> 스캔 문서·이미지를 AI가 분석하여 텍스트를 자동 추출하고, 검색 가능한 디지털 문서로 변환

- Canonical: https://heyratty.io/portfolio/ai-ocr-text-extraction
- Category: AI 자동화
- Client: B2B 기업
- Period: 2025.12
- Tech: Python, Gemini Vision API, OpenClaw, PDF Processing
- Before → After: 문서당 10분 → 10초

## Challenge
종이 문서, 스캔 파일, 사진 속 텍스트를 AI 비전 모델이 자동으로 인식·추출하는 기능입니다.

## Solution
추출된 텍스트는 구조화된 형태로 정리되어, 검색·편집·후속 업무 자동화에 바로 활용할 수 있습니다.

## Features
- **AI 비전 기반 텍스트 인식** — 기울어진 문서, 손글씨, 복잡한 표 등 기존 OCR이 놓치는 영역까지 AI가 정확하게 인식합니다.
- **다국어 자동 인식** — 한국어, 영어, 일본어, 중국어 등 다국어 문서를 별도 설정 없이 자동 인식합니다.
- **레이아웃 보존 추출** — 표, 목록, 단락 구분 등 원본 문서의 구조를 유지한 채 텍스트를 추출합니다.
- **대량 배치 처리** — 수백 장의 문서를 폴더에 넣으면 자동으로 순차 처리하여 결과물을 일괄 생성합니다.

## Flow
1. **문서 입력** — "이 스캔 문서에서 텍스트 추출해줘"
2. **AI 비전 엔진** — 레이아웃 분석 · 텍스트 인식 · 구조화 정리
3. **결과 저장** — 텍스트 파일 또는 검색 가능 PDF로 자동 저장

## Results
- 수작업 입력 시간: 문서당 10분 → 10초, 98% 단축
- AI 비전 모델 기반 인식률: 99% 이상 (인쇄 문서 기준)
- 다국어 문서 추가 비용 제로: 언어별 엔진 불필요
- 폴더 감시 연동: 완전 무인 자동화 운영 가능

## Contact
- Email: contact@heyratty.io
- Website: https://heyratty.io