인코딩 정보

관련 도구

사용 방법

텍스트를 입력하면 UTF-8, EUC-KR 등 인코딩별 바이트 수와 코드 포인트를 즉시 분석합니다. 같은 문자라도 인코딩 방식에 따라 차지하는 바이트 수가 다르므로, 파일 크기 예측이나 API 요청 제한 확인 시 유용하게 활용할 수 있습니다.

인코딩이란

인코딩은 문자를 컴퓨터가 처리할 수 있는 바이트로 변환하는 규칙입니다. UTF-8은 유니코드 기반으로 전 세계 모든 문자를 지원하며, 영문자는 1바이트, 한글은 3바이트로 저장됩니다. EUC-KR은 한국어 전용 인코딩으로 한글을 2바이트로 표현하며, 주로 레거시 시스템에서 사용됩니다.

활용 예시

데이터베이스 컬럼 길이 설정, HTTP 헤더 크기 계산, SMS 메시지 바이트 제한 확인 등에 활용할 수 있습니다. 특히 한국어와 영어가 혼합된 텍스트의 실제 바이트 크기를 정확히 파악할 때 도움이 됩니다.

인코딩 방식 비교

UTF-8과 EUC-KR은 한국어 웹에서 가장 많이 쓰이는 두 가지 인코딩입니다. 현재 대부분의 웹 표준은 UTF-8을 권장하며, EUC-KR은 레거시 시스템에서 주로 사용됩니다.

항목 UTF-8 EUC-KR
한글 1자 3바이트 2바이트
영문/숫자 1자 1바이트 1바이트
이모지 4바이트 지원 안 함
지원 범위 유니코드 전체 (110만 자 이상) 한국어 + 영문 + 일부 특수문자
웹 표준 권장 (HTML5 기본값) 레거시 시스템용