미국인으로서 저는 로케일로 en.UTF-8 또는 ISO-8859-1 인코딩을 확실히 선택할 수 있습니다.
대부분의 가이드에서는 UTF-8 인코딩 사용을 권장하지만 멀티바이트 인코딩이라는 점이 조금 걱정됩니다. 이것을 사용하면 어떤 결과가 발생합니까? 일부 텍스트 파일에 짜증나는 문자 시퀀스가 있습니까 t h a t l o o k l i k e t h i s
? 이 두 가지 옵션의 장단점은 무엇입니까?
예를 들어, 그래픽 창 관리자에서 브라우저를 사용하고 있다고 가정해 보겠습니다. ISO-8859-1을 로케일로 선택했기 때문에 브라우저가 UTF-8 문자를 표시할 수 없습니까?
답변1
로캘 사양:
- 터미널에서 어떤 문자를 수신하고 출력할 수 있나요?
- 터미널 애플리케이션에서 어떤 문자를 수신하고 출력할 수 있나요?
- 애플리케이션 언어
그래픽 응용 프로그램에 영향을 미칠 가능성은 거의 없습니다.
제공하신 예는 UTF-16 인코딩이며 최소 데이터 단위는 16비트/2바이트입니다. .iconv
C/ISO-8859-1로 전환하지 말 것을 강력히 권장합니다.
- ASCII로 처리되지 않은 텍스트는 처리할 수 없습니다.
- ASCII로 처리되지 않는 문자는 콘솔에 표시할 수 없습니다.
마지막으로 UTF-8은 멀티바이트 인코딩입니다.오직ASCII가 적용되지 않는 기호의 경우. ASCII 텍스트는 UTF-8로 처리될 수 있습니다.
이 답변도 확인하세요.UTF-8과 ISO-8859-1의 차이점은 무엇입니까?