인코딩 정보
관련 도구
사용 방법
텍스트를 입력하면 UTF-8, EUC-KR 등 인코딩별 바이트 수와 코드 포인트를 즉시 분석합니다. 같은 문자라도 인코딩 방식에 따라 차지하는 바이트 수가 다르므로, 파일 크기 예측이나 API 요청 제한 확인 시 유용하게 활용할 수 있습니다.
인코딩이란
인코딩은 문자를 컴퓨터가 처리할 수 있는 바이트로 변환하는 규칙입니다. UTF-8은 유니코드 기반으로 전 세계 모든 문자를 지원하며, 영문자는 1바이트, 한글은 3바이트로 저장됩니다. EUC-KR은 한국어 전용 인코딩으로 한글을 2바이트로 표현하며, 주로 레거시 시스템에서 사용됩니다.
활용 예시
데이터베이스 컬럼 길이 설정, HTTP 헤더 크기 계산, SMS 메시지 바이트 제한 확인 등에 활용할 수 있습니다. 특히 한국어와 영어가 혼합된 텍스트의 실제 바이트 크기를 정확히 파악할 때 도움이 됩니다.
인코딩 방식 비교
UTF-8과 EUC-KR은 한국어 웹에서 가장 많이 쓰이는 두 가지 인코딩입니다. 현재 대부분의 웹 표준은 UTF-8을 권장하며, EUC-KR은 레거시 시스템에서 주로 사용됩니다.
| 항목 | UTF-8 | EUC-KR |
|---|---|---|
| 한글 1자 | 3바이트 | 2바이트 |
| 영문/숫자 1자 | 1바이트 | 1바이트 |
| 이모지 | 4바이트 | 지원 안 함 |
| 지원 범위 | 유니코드 전체 (110만 자 이상) | 한국어 + 영문 + 일부 특수문자 |
| 웹 표준 | 권장 (HTML5 기본값) | 레거시 시스템용 |