본문 바로가기
728x90

utf-81

[기타]UTF-8 이란? UTF-8은 유니코드를 위한 가변길이 문자 인코딩 방식 중 하나 Universal Coded Character Set + Transformation Format - 8 -bit 의 약자 UTF-8은 유니코드 한 문자를 표현하기 위해 최대 4바이트까지 사용 아스키 문자들은 1바이트만을 사용하며 한글은 3바이트를 사용 4바이트로 표현되는 문자는 기본 다국어 평면 외의 유니코드 문자이며 거의 사용되지 않음 아스키 문자는 1 바이트만을 사용하므로 7비트 아스키문자와 동일한 방법으로 표시 다른 문자들은 4바이트까지의 비트 패턴으로 표시 1바이트 : 0xxxxxxx 로 표현되며 항상 최상위 비트가 0 2바이트 : 110xxxxx 10xxxxxx 로 표현되며 첫 바이트의 최상위 3비트는 항상 110으로 시작 3바이트.. [프로그래밍 공부]/기타 2021. 12. 11.
728x90