코진남

0과 1로 문자를 표현하는 방법 본문

컴퓨터 구조

0과 1로 문자를 표현하는 방법

woojin126 2023. 5. 19. 18:19

문자 집합과 인코딩

  1. 컴퓨터가 인식하고 표현할 수 있는 문자의 모음을 문자 집합 이라고한다. 컴퓨터는 문자집합에 포함되지 않는 문자는 이해 할 수 없다.

  2. 문자를 0과 1로 변환해야 비로소 컴퓨터가 이해할 수 있다. 이 변환 과정을 문자 인코딩이라고 한다. 반대는 문자 디코딩

아스키 코드

아스키코드는 초창기 문자집합중 하나. 7비트로 표현할 수 있는 정보의 가짓수는 128개 (아스키코드 표 참조)

EUC-KR

  1. 한글 인코딩을을 위해 탄생. 한글을 음절 하나하나가 초성, 중성, 종성의 조합으로 이루어져 있다. 그래서 한글 인코딩에는 두가지 방식, 완성형, 조합형이 있다.
    • 완성형 인코딩: '가' '나' '다' 와같이 완성된 글자에 고유한 코드를부여
    • 조합형 인코딩: 초성을 위한 비트열, 중성을 위한 비트열, 종성을 위한 비트열 각각을 인코딩하는 방식 (ㅏ,ㅓ,ㅕ,ㅗ 등등)
  2. 한글은 한글자에 2바이트가 필요하다. euc-kr로 인코딩된 한글 한 글자를 표현하려면 16비트가 필요한데, 16비트는 네 자리 십육진수로 표현을할 수 있다.

유니코드와 UTF-8

  1. EUC-KR 인코딩덕분에 한국어를 코드로 표현이 가능해졌지만. 그래도 한글 전부를 표현하기에는 한계가 있다. 더욱이 나라마다 언어별로 인코딩을 해야한다면 다국어를 지원하는 프로그램을 만들 때 각 나라 언어의 인코딩을 모두 알아야한다는 번거러움 이 있다. 이러한 불편한점을 개선하기위해 모두 통합한 인코딩 방식이 유니코드 및 UTF-8 인코딩 방식이다.

'컴퓨터 구조' 카테고리의 다른 글

명령어와 구조  (0) 2023.05.19
소스 코드와 명령어  (0) 2023.05.19
컴퓨터 구조의 큰 그림  (0) 2023.05.19
[컴퓨터 구조 기초]  (0) 2022.07.12