반응형

컴퓨터에서 문자를 표현하는 방법

 

 

05 - 컴퓨터에서의 숫자 표현

0과 1만으로 숫자를 표현하는 방법 일상생활에서 숫자를 표현할 때 주로 십진법을 사용한다. 그러나 0과 1로 숫자를 표현하려면 이진법을 사용해야 한다. 이진법 이진법은 다음 표와 같이 숫자가

jschan0911.tistory.com

이전 게시물에서는

컴퓨터에서 숫자를 표현하는

방법에 대해서 알아보았다.

 

이번에는 위 개념의 연장선에서

문자를 표현하는 방법에 대해서

알아볼 것이다.

 

문자 집합 / 인코딩 / 디코딩

컴퓨터에서 문자를 표현하는

방법에 대해서 알기 위해서

문자 집합, 인코딩, 디코딩에 대해서

알아야 한다.

 

문자집합이란

'컴퓨터가 인식하고 표현할 수 있는

문자의 모음'을 의미한다.

 

인코딩이란

'문자를 0과 1로 변환하는 과정'

의미한다.

 

디코딩이란

인코딩의 반대 과정으로

'0과 1로 표현된 문자코드를

문자로 변환하는 과정'

의미한다.

 

아스키 코드

아스키 코드는 위 사진과 같이

문자들을 7비트로 표현하는

문자 집합이다.

 

7비트로 표현할 수 있는

정보의 개수는 128개이다.

 

때문에 영어나 숫자를 사용하지 않는

다른 언어권의 문자를 표현하기 위해서

7비트로 표현하는 아스키 코드 방식은

역부족이다.

 

EUC-KR / CP949

이러한 문제를 해결하기 위한

한글 인코딩 방식 중 하나로

EUC-KR이 존재한다.

 

EUC-KR은 위 사진과 같이

하나의 글자에 고유한 코드를

부여하는 인코딩 방식이다.

 

그러나 문자 집합에 정의되지 않은

문자의 경우 표현할 수 없다는

어려움이 있다.

 

이러한 문제를 해결하기 위해

만들어진 방식이

MS의 CP949이며,

실제로 대다수의 한글을

표현할 수 있게 되었다.

 

그러나,

이 방식 역시 모든 문자를

표현할 수는 없었다.

 

유니코드 / UTF-8

컴퓨터에서 어렵사리 구현해낸

한글이지만, 다른 나라에서 볼 때는

제대로 보이지 않는다면,

 

한글을 제대로 보기 위해서

그때마다 인코딩을 각각 해야 한다면

 

너무나 번거롭고 어려운 작업일 것이다.

 

이를 해결하기 위해

모든 나라 언어의 문자 집합과

인코딩 방식을 통일

'유니코드' 문자집합이 등장했다.

 

UTF-8은

유니코드의 인코딩 방식 중 하나로

1바이트 ~ 4바이트까지의

인코딩 결과를 만들어낸다.

반응형

+ Recent posts