블로그 목록으로
텍스트 편집
2026년 5월 16일

영수증·견적서 텍스트 정리 자동화 방법

종이 영수증이나 PDF 견적서에서 텍스트를 추출하고 정리하는 자동화 방법과 엑셀·스프레드시트 연동 워크플로를 단계별로 설명합니다.

Q.영수증이나 견적서 텍스트를 자동으로 정리하는 방법이 있나요?

네, 자동화가 가능합니다. 종이 영수증은 스마트폰 OCR 앱(구글 렌즈, 네이버 클로바)으로 텍스트를 추출하고, PDF 견적서는 pdfplumber(Python) 또는 Adobe Acrobat으로 추출합니다. 이후 날짜·금액 패턴을 정규식으로 파싱하면 엑셀 스프레드시트에 자동 정리할 수 있습니다.

영수증 텍스트 정리견적서 자동화OCR 영수증

경리 담당자의 하루 중 상당한 시간이 영수증·견적서 텍스트를 수동으로 옮기는 데 사용된다. 종이 영수증 50장을 엑셀에 수기 입력하면 평균 2-3시간이 소요되지만, 자동화 파이프라인을 구축하면 동일 작업을 15분 이내에 처리할 수 있다.

자동화 워크플로 개요


영수증/견적서 원본
    ↓ (OCR 또는 PDF 파싱)
텍스트 추출
    ↓ (정규식 파싱)
구조화 데이터 (날짜, 금액, 항목)
    ↓ (엑셀/스프레드시트 연동)
자동 정리 완료

1단계: 텍스트 추출

종이 영수증

  • 구글 렌즈: 스마트폰 카메라로 찍으면 즉시 텍스트 추출. 인식률 약 90%
  • 네이버 클로바 OCR: 한국어 특화. 영수증 전용 API 제공 (월 500건 무료)
  • CamScanner/Adobe Scan: 여러 장을 일괄 스캔 후 PDF 변환

PDF 견적서

python
import pdfplumber

with pdfplumber.open("invoice.pdf") as pdf:
    for page in pdf.pages:
        text = page.extract_text()
        print(text)

2단계: 핵심 데이터 파싱

추출된 텍스트에서 날짜와 금액을 정규식으로 추출한다.

python
import re

# 날짜 패턴 (2024-01-15 또는 2024.01.15)
date_pattern = r'd{4}[-./]d{2}[-./]d{2}'

# 금액 패턴 (1,234,567원 또는 ₩1,234,567)
amount_pattern = r'[₩s]?[d,]+원'

dates = re.findall(date_pattern, text)
amounts = re.findall(amount_pattern, text)

3단계: 엑셀 자동 입력

파싱 결과를 openpyxl로 엑셀에 자동 기록하거나, 구글 스프레드시트 API로 클라우드 문서에 직접 연동한다. 100건 기준 처리 시간은 약 30초다.

무료 대안 (코딩 불필요)

  • 구글 스프레드시트 + 구글 렌즈: 렌즈로 추출 → 복사 → 시트에 붙여넣기
  • 마이크로소프트 365 수식: =TRIM(CLEAN(A1))로 불필요한 공백·특수문자 일괄 제거
  • 텍스터브 도구: 추출된 텍스트의 공백 정리와 글자수 확인에 활용

---

이 글은 AI가 공개 자료를 기반으로 작성했습니다. OCR 인식률은 영수증 상태와 폰트에 따라 차이가 있습니다.

추출된 텍스트 정리하기

바로 가기 →

관련 글

추가 참고 자료

다른 글 보기