유니코드
-
UTF-8과 UTF-16이란?카테고리 없음 2019. 6. 21. 09:06
지난번에 유니코드에 관련된 포스팅에 이어서 이번에는 대표적인 유니코드 인코딩 방법인 UTF-8과 UTF-16에 대해서 알아보겠습니다 다들 프로그래밍을 개발하시면서 UTF-8, UTF-16에 대한 내용을 많이 봤을 거라고 생각이 듭니다 그렇다면 이렇게 많이 사용하는 UTF-8이란 무엇일까요? 지난번에 말씀드렸다 싶이 유니코드는 ASCII처럼 문자들의 코드표입니다 UTF-8이란 유니코드의 값을 인코딩하는 방식 중 하나일 뿐입니다 (물론 UTF-16 또한 마찬가지) 그렇다면 어떻게 동작하는지 알아보면 위의 이미지에 대한 동작 방식을 알면 됩니다!!! (간단하죠?) UTF-8은 가변 길이 방식의 인코딩 방법입니다 가변 길이라는게 어떤 말이냐 하면 인코딩 된 값이 1~4 byte의 값을 동적으로 얻는다는 말입니다..
-
유니코드에 대해서 아시나요?프로그래밍 2019. 6. 18. 09:09
안녕하세요 오늘은 프로그래밍을하면서 흔히 볼수있는 유니코드에 대해서 알아보는 시간을 가지려고 합니다 컴퓨터에서는 모든 데이터를 0 아니면 1로 표현하는 이진수로 사용합니다 초기에는 이를 표현 하는 ASCII값을 이용해서 값들을 표현했죠 아스키 코드표는 모든데이터를 1byte 즉 8bit로 표현합니다 거기서 맨 앞 1bit는 패리티 비트라고 해당하는 데이터의 에러 검사 여부를 위해서 사용합니다 그렇기에 2^7인 128개의 문자가 표현이 가능한거죠 그런데 여기서 문제가 있습니다 아스키 코드표에 해당하지 않는 문자를 표현하려면 어떻게 해야할까요? 결국 해당하는 코드표를 추가하는 방법 밖에 없을겁니다 그렇기에 다음으로 나오는 ANSI 코드가 있지만 이 내용은 이 포스팅에서는 다루지 않겠습니다 (너무 길어질까봐...