누락되거나 일치하지 않는 문자를 방지하려면 어떤 중국어 로케일 설정이 필요합니까?

누락되거나 일치하지 않는 문자를 방지하려면 어떤 중국어 로케일 설정이 필요합니까?

Arch Linux는 다음과 같은 다양한 중국어 로케일을 나열합니다 /etc/locale.gen.

#zh_CN.GB18030 GB18030
#zh_CN.GBK GBK
#zh_CN.UTF-8 UTF-8
#zh_CN GB2312
#zh_HK.UTF-8 UTF-8
#zh_HK BIG5-HKSCS
#zh_SG.UTF-8 UTF-8
#zh_SG.GBK GBK
#zh_SG GB2312
#zh_TW.EUC-TW EUC-TW
#zh_TW.UTF-8 UTF-8
#zh_TW BIG5

이러한 로캘은 지역별로 다르지만(일본과 한국은 포함하지 않고 중국, 홍콩, 싱가포르, 대만을 나타냄) 여전히 지역별로 여러 로캘이 있습니다.

한자는 체계적이지 않고 사용 영역이 넓기 때문에 한자를 UTF에 통합하는 과정은 쉽지 않습니다. 사용법은 지역마다 다릅니다. 동일한 한자에는 다양한 변형이 있고 정치적, 문화적 요인도 작용하며, 같은 지역 내에서도 사람들은 필기체뿐만 아니라 공식 한자보다 특정 한자의 변형을 선호할 수도 있습니다.

일부 기술적인 문제에 대한 설명여기평신도의 관점에서.

제가 이해한 바에 따르면 중국어 번체와 중국어 간체의 동일한 문자(예: "you")와 "간체" 또는 "번체"라는 동일한 범주에 있는 동일한 문자의 다른 변형은 동일한 코드 포인트를 가지며 문자 변형은 다르게 사용됩니다. 글꼴이 구현되었습니다.

대신 충분히 다른 버전(예: "from" 및 "from"과 같은 다양한 단순화 및 전통 문자)은 서로 다른 코드 포인트를 가지므로 동일한 문자의 여러 버전이 동일한 글꼴에 포함될 수 있습니다.

이러한 서로 얽힌 특성(간체, 번체 및 문자 변형은 모두 UTF에 포함되어 있음)은 중국어에 왜 이러한 다양한 로케일이 필요한지, 그리고 사용자가 이를 모두 설치해야 하는지에 대한 질문으로 이어집니다.


충분한 글꼴이 설치된 시스템(각 문자를 표시하기 위해 시스템에 글리프가 있음):

대부분의 문자를 올바르게 표시하려면 어떤 로케일이 실제로 필요합니까?

어떤 중국어 인코딩이 다른 인코딩으로 병합되었습니까? 예를 들어 UTF는 Big5 또는 ASCII와 같은 다른 중국어 인코딩과 역호환됩니까?

답변1

나는 중국 정치와 중국어 지식 부족을 피하기 위해 서양의 예를 사용하겠습니다.

관련 정보