# OCR → 검색 가능 PDF 변환

> 스캔 문서를 AI로 분석하여 텍스트 레이어가 포함된 검색 가능 PDF로 자동 변환

- Canonical: https://heyratty.io/portfolio/ocr-searchable-pdf
- Category: AI 자동화
- Client: B2B 기업
- Period: 2025.12
- Tech: Python, Gemini Vision API, PDF Processing, OpenClaw
- Before → After: 검색 불가 → 즉시 검색

## Challenge
스캔된 종이 문서나 이미지 PDF를 AI가 분석하여, 텍스트를 검색·복사·편집할 수 있는 PDF로 자동 변환하는 기능입니다.

## Solution
기존 이미지 PDF는 내용 검색이 불가능하지만, 변환 후에는 Ctrl+F로 원하는 내용을 즉시 찾을 수 있습니다.

## Features
- **투명 텍스트 레이어 삽입** — 원본 이미지 위에 텍스트 레이어를 정확한 위치에 삽입하여, 시각적으로는 동일하면서 검색이 가능한 PDF를 생성합니다.
- **페이지별 자동 처리** — 수백 페이지 문서도 페이지별로 자동 분석하여 한 번에 변환합니다.
- **원본 품질 유지** — 이미지 압축 없이 원본 해상도를 그대로 유지하며 텍스트 레이어만 추가합니다.
- **배치 폴더 감시** — 지정 폴더에 파일이 들어오면 자동으로 변환을 시작하여 무인 운영이 가능합니다.

## Flow
1. **문서 업로드 입력** — "이 스캔 PDF 검색 가능하게 변환해줘"
2. **AI 자동 인식** — 페이지별 텍스트 감지 · 투명 레이어 삽입
3. **검색 가능 PDF 생성** — 원본 품질 유지 후 즉시 저장

## Results
- 수동 탐색 30분 → 키워드 검색 3초: 문서 검색 시간
- 수작업 대비 99% 시간 절감: 수백 장 문서 일괄 변환
- 원본 품질 100% 유지: 텍스트 검색 기능 추가
- 문서 아카이빙 및 컴플라이언스: 대응 자동화

## Contact
- Email: contact@heyratty.io
- Website: https://heyratty.io
