텍스트 편집

2026년 5월 16일

한·중·일 글자수 산출 기준 비교

한국어·중국어·일본어의 글자수 계산 방식 차이와 CJK(Chinese-Japanese-Korean) 문자 처리의 기술적 배경, 다국어 콘텐츠 제작 시 주의사항을 설명합니다.

Q.한국어·중국어·일본어에서 글자수를 계산하는 방식이 다른가요?

네, 다릅니다. 한국어는 음절(가나다) 단위로 계산하고, 중국어는 한자 1자=1글자로 계산합니다. 일본어는 히라가나·가타카나·한자를 혼용하는데, 일반적으로 문자 개수(字数)로 계산합니다. 유니코드에서는 세 언어 모두 대부분 BMP(Basic Multilingual Plane) 영역에 속합니다.

한중일 글자수CJK 문자다국어 글자수 계산

중국 파트너사에서 받은 계약서가 "3,000자 이내"라고 했는데 한국어로 번역했더니 6,000자가 넘었다면, 한·중 글자수 개념이 다르기 때문이다. 다국어 문서를 다룰 때 이 차이를 모르면 분량 협의에서 오해가 생긴다.

핵심 답변

네, 다릅니다. 한국어는 음절(가나다) 단위로 계산하고, 중국어는 한자 1자=1글자로 계산합니다. 일본어는 히라가나·가타카나·한자를 혼용하는데, 일반적으로 문자 개수(字数)로 계산합니다. 유니코드에서는 세 언어 모두 대부분 BMP(Basic Multilingual Plane) 영역에 속합니다.

언어별 글자(文字) 개념

언어	글자 단위	예시
한국어	음절(자모 결합)	"가" = 1자, "박" = 1자
중국어(중화권)	한자	"中" = 1字
일본어	문자(字) 혼용	"あ" = 1字, "漢" = 1字
영어	글자(letter) 또는 단어	"a" = 1 character

한국어 글자수 계산

한국어에서 "글자수"는 일반적으로 음절(음절 단위 글자) 기준이다.

"안녕하세요" = 5자 (음절 5개)
"대한민국" = 4자
공백도 1자로 계산하는 경우와 그렇지 않은 경우가 있음

자소(자음+모음) 분리 시 "ㄱ", "ㅏ" 각각 1자로 세는 경우도 있으나(자소 기준), 일반적인 글자수는 음절 기준이다.

중국어 글자수 계산

중국어(간체·번체)에서 "字数"는 한자 1개=1字다.

"你好" = 2字
구두점도 1字로 계산하는 경우 多
공백은 일반적으로 글자수에 미포함

중국 학술 논문은 보통 "8,000字 이내"처럼 字数 기준을 사용한다.

일본어 글자수 계산

일본어는 히라가나·가타카나·한자·로마자가 혼용된다.

"日本語" = 3文字 (한자)
"にほんご" = 4文字 (히라가나)
원고지 계산(400字詰): 1칸=1文字, 공백·구두점도 1칸

일본 출판 시장에서는 "원고지 몇 장"으로 분량을 말하는 관행이 있다(400자 원고지 기준).

CJK 문자의 기술적 처리

유니코드에서 한·중·일 한자는 CJK Unified Ideographs 블록(U+4E00~U+9FFF)에 통합되어 있다. 이 블록에는 20,902개의 기본 한자가 포함된다.

프로그래밍에서 글자수를 셀 때 주의:

python
# Python: len()은 유니코드 코드포인트 수
len("안녕") == 2   # True (음절 기준)
len("🎉") == 1    # True (이모지 1개)

# 이모지 중 일부는 여러 코드포인트 조합
len("👨‍👩‍👧") == 8  # 가족 이모지는 ZWJ 시퀀스로 8 코드포인트

다국어 환경에서 글자수 제한을 구현할 때는 "코드포인트 수"가 아닌 사용자에게 보이는 "글자 수"(grapheme cluster)로 계산해야 한다.

실전 적용 가이드: 다국어 콘텐츠 분량 계획

1단계: 언어별 글자 단위 통일

다국어 문서 협업 시 분량 기준을 통일합니다. "3,000자 이내"처럼 쓰면 한국어·중국어·일본어 담당자가 각기 다른 기준으로 이해합니다. "한국어 3,000음절 / 중국어 3,000字 / 일본어 3,000字 / 영어 500단어"처럼 언어별로 명시합니다.

2단계: 번역 후 분량 재측정

한국어 3,000자 기준으로 작성한 콘텐츠를 중국어로 번역하면 약 1,500-2,000字로 줄어들 수 있습니다. 번역 후 각 언어의 분량을 재측정해 레이아웃을 조정합니다.

3단계: 글자수 세기 도구 선택

언어별로 적합한 글자수 세기 도구를 선택합니다. 한국어는 음절 기준, 중국어는 한자 수, 일본어는 문자(字) 수, 영어는 단어 수를 기준으로 세는 도구를 확인합니다.

4단계: 프로그래밍 처리 시 grapheme cluster 사용

다국어 앱에서 텍스트 길이를 제한할 때는 유니코드 grapheme cluster 라이브러리를 사용합니다. Python의 경우 grapheme 패키지, JavaScript는 Intl.Segmenter를 활용합니다.

전/후 예시: 다국어 분량 차이

동일한 내용을 세 언어로 표현한 예:

언어	텍스트	글자수
한국어	"오늘 회의가 오전 10시에 시작합니다"	18자 (음절)
중국어	"今天会议上午10时开始"	10字
일본어	"今日の会議は午前10時に始まります"	16字
영어	"Today's meeting starts at 10 AM"	6단어

체크리스트

[ ] 다국어 문서에서 분량 기준을 언어별로 명시했는가
[ ] 번역 후 분량 변화를 예측해 레이아웃 여유 공간을 확보했는가
[ ] 프로그래밍에서 이모지·특수 문자를 포함한 글자수 계산을 검증했는가
[ ] CJK 통합 한자 처리가 필요한지 확인했는가
[ ] 각 언어의 구두점·공백 처리 방식 차이를 확인했는가

자주 묻는 질문

Q. 한국어 글자수와 중국어 字数는 직접 비교할 수 있나요?

직접 비교는 어렵습니다. 한국어 음절 하나("국")와 중국어 한자 하나("國")는 개념상 비슷하지만, 한국어는 조사·어미가 별도 음절로 카운트되기 때문에 같은 내용을 표현할 때 한국어가 중국어보다 1.5-2배 많은 "글자"가 필요합니다.

Q. 일본어 원고지(400字詰) 기준과 한국어 글자수를 어떻게 환산하나요?

일본 400字詰 원고지 1장(400字)은 한국어 약 600-700자에 해당합니다. 일본어는 문자 밀도가 높아 같은 내용을 한국어보다 적은 字수로 표현하는 경향이 있습니다.

마무리

이 글에서 정리한 기준을 실제 작업에 적용할 때는 [텍스터브 글자수 세기](/tools/char-counter/) 도구로 분량을 직접 확인하면서 진행하면 더 정확하게 맞출 수 있다.

한·중·일 글자수 산출 기준 비교

Q.한국어·중국어·일본어에서 글자수를 계산하는 방식이 다른가요?

핵심 답변

언어별 글자(文字) 개념

한국어 글자수 계산

중국어 글자수 계산

일본어 글자수 계산

CJK 문자의 기술적 처리

실전 적용 가이드: 다국어 콘텐츠 분량 계획

전/후 예시: 다국어 분량 차이

체크리스트

자주 묻는 질문

마무리

글자수 세기 도구 사용하기

관련 글

번역 텍스트 분량 차이

유니코드 특수문자 입력법

추가 참고 자료

다른 글 보기

웹소설 회차 분량 최적화 가이드 — 네이버 시리즈·카카오페이지 5단계 전략

시·단편소설·장편소설 분량 기준 비교 — 문학 장르별 글자수 가이드