Korean Encoding

2017.01.10

Encoding

: 데이터를 코드화 하는 것.

한글 인코딩 방식

조합형 방식

  1. 자음과 모음을 초성, 중성, 종성으로 구분하여 문자를 작성.
  2. 초성, 중성, 종성을 따로 인식하고 그 것들을 하나의 바이트로 인식.

완성형 방식

  1. 문자를 하나의 완성되어져 있는 글자로 인식.
  2. 오래된 한글 표현 방식

조합형과 완성형의 예

조합형 방식이 한글을 표현하는 데에 가장 좋은 방법! 그러나 윈도우 윈코딩 방식은 완성형입니다.

‘왜 이게 웹 서비스를 시작하면서 문제가 되는가?’

UTF-8과 EUC-KR 중에서 인코딩을 똑같이 맞춰야 문자 표현이 가능하기 때문입니다.

UTF-8

: 대표적인 조합형의 유니코드 인코딩 방식

  1. 조합형 방식의 문자 집합, 유니코드 인코딩 방식 중 하나
  2. 한글을 3바이트로 인식, 공백이나 영문은 1바이트로 인식
  3. 유니코드의 경우, 다른 국가에서 한글 언어책이 설치되지 않았다고 하더라도 한글 표현이 가능
  4. 다양한 언어로 작성되는 환경이나 웹과 같은 다양한 국가의 사람들이 보는 경우에 매우 좋은 방식

EUC-KR,CP949

: 윈도우에서 가장 많이 사용

  1. 완성형 인코딩 방식
  2. 한글을 2바이트로 사용하는 문자집합

한글 인코딩을 조사해보면서 잘 정리가 되어 있는 글이기에 URL을 남겨봅니다. http://studyforus.tistory.com/167