XML 텍스트 파일에 "^@" 문자가 포함되어 있습니까?

XML 텍스트 파일에 "^@" 문자가 포함되어 있습니까?

구문 분석해야 하는 XML 파일이 있습니다. nano에서 열면 nano에서 메시지를 보냅니다 (converted from Mac format). 그러나 ^@아래와 같이 각 문자 사이에는 순서가 있습니다 .

^@t^@h^@e^@ ^@q^@u^@i^@c^@k^@ ...

이것은 어떤 형식이며 올바르게 표시하려면 어떻게 해야 합니까? 어떻게 변환할 수 있나요?

답변1

더블바이트 형식일 수 있습니다.UTF-16. 식별할 수 있는지 확인하세요.BOM(바이트 순서 표시)파일 헤더는 파일의 시작 부분에 있습니다. 인코딩이 존재하는지 여부는 알려줄 수 있지만 그렇지 않을 수도 있습니다. 텍스트 편집기에서는 이 내용을 숨길 수 있으므로 파일을 보려면 16진수 덤프 유틸리티를 사용해야 할 수도 있습니다.od또는 BOM을 보는 것과 유사한 것입니다.

도움이 될 수 있는 몇 가지 문자 집합 변환 유틸리티가 있습니다. 몇 가지 예는 다음과 같습니다iconv그리고recode. 이 중 하나를 사용하여 파일을 텍스트 편집기에 적합한 형식으로 다시 인코딩할 수 있습니다.

프로그래밍 방식으로 번역해야 하는 경우 대부분의 언어(예: Python)에는 인코딩 체계 간 매핑을 위한 라이브러리가 있습니다. www.unicodetools.com다양한 언어로 관련된 주문을 보여줍니다. 유용한 유니코드 FAQ는 다음에서 찾을 수 있습니다.여기그리고 유니코드 얼라이언스웹사이트이 주제에 관한 유용한 자료가 많이 있습니다.

관련 정보