PDF 검색 가능 변환 (OCR)

스캔된 PDF의 글자를 인식해 텍스트 드래그·복사·검색이 가능한 PDF로 변환합니다. 원본 이미지는 그대로 유지되고 그 위에 보이지 않는 텍스트 레이어가 깔립니다.

개요

검색 가능 PDF (OCR)는 스캔으로 만든 이미지 PDF의 글자를 인식해 텍스트 선택·복사·검색이 되는 PDF로 변환하는 도구입니다. 원본 이미지는 그대로 유지되며 그 위에 보이지 않는 텍스트 레이어가 깔리는 방식이라 시각적으로는 변화가 없습니다. 사업자등록증·계약서·신분증 사본처럼 인쇄된 정형 문서에 가장 잘 작동합니다.

실무 활용 팁

첫 사용 시 한글·영어 인식 학습 데이터(약 5~10MB)를 자동 다운로드합니다. 이후 같은 브라우저에서는 캐시되어 빠르게 시작합니다.
처리 시간은 페이지당 5~30초 — 오래 걸리는 만큼 PDF 탭을 닫지 말고 기다리세요. 30페이지 분량은 보통 5~15분 소요.
"한국어 + 영어" 모드는 가장 균형 잡힌 정확도를 제공합니다. 영어만 있는 문서면 "영어만"이 빠릅니다.
인식 정확도가 낮으면: ① 원본 스캔을 300dpi 이상 고해상도로 다시 떠서 변환 ② 페이지를 똑바로 회전 후 변환 ③ 콘트라스트 보정 (이미지 편집 후 PDF 재생성).
결과 PDF는 원본 이미지 + 텍스트 레이어 형태로, 파일 크기가 비슷하거나 약간 커집니다.
결과 PDF 에서 Ctrl+F (Mac: Cmd+F) 로 검색이 되거나, 텍스트가 드래그되면 변환 성공입니다.

자주 묻는 질문

Q. 인식이 잘 안 되는 이유가 뭔가요?

저해상도 스캔(150dpi 이하), 손글씨, 워터마크와 겹친 글자, 기울어진 페이지, 너무 작은 글자(8pt 이하) 등이 주 원인입니다. 원본을 더 깨끗하게 다시 스캔하면 크게 개선됩니다.

Q. 결과 PDF에 보이는 글자가 이상해요. 잘못된 건가요?

원본 이미지는 그대로 표시되므로 시각적 변화는 없어야 정상입니다. 만약 이상한 텍스트가 보인다면 변환 실패 — 다시 시도하거나 원본 품질을 점검해 보세요.

Q. 왜 일부 글자가 검색되지 않나요?

OCR 신뢰도가 30% 미만인 단어는 자동으로 텍스트 레이어에서 제외됩니다. 인식 실패 글자는 원본 이미지로만 남으며 검색 대상이 되지 않습니다.

Q. 서버에 파일이 업로드되나요?

아니오. PDF 로딩, OCR 인식, 새 PDF 생성 모두 사용자 브라우저 안에서만 이루어지며 서버에는 어떤 파일도 전송되지 않습니다.

Q. 한자·일본어도 인식되나요?

현재는 한국어 + 영어 학습 데이터만 로드합니다. 한자가 섞인 경우 인식이 누락될 수 있습니다.

검색 가능 PDF 변환 (OCR)

개요

실무 활용 팁

자주 묻는 질문

함께 쓰기 좋은 도구