저는 데비안과 그 파생물을 연구하고 있습니다. 원시 입력 ISO-IR-87을 UTF-8로 변환하고 싶습니다. 쉬운 방법이 있나요?
참고로:
% iconv -l | grep "IR-8"
ISO-IR-8-1//
ISO-IR-84//
ISO-IR-85//
ISO-IR-86//
ISO-IR-88//
ISO-IR-89//
% dpkg -S /usr/bin/iconv
libc-bin: /usr/bin/iconv
% apt-cache policy libc-bin
libc-bin:
Installed: 2.36-9+deb12u3
Candidate: 2.36-9+deb12u3
Version table:
*** 2.36-9+deb12u3 500
500 http://security.debian.org/debian-security bookworm-security/main amd64 Packages
100 /var/lib/dpkg/status
2.36-9+deb12u2 500
500 http://deb.debian.org/debian bookworm/main amd64 Packages
내 시스템에서 녹음이 작동하는 것 같습니다(@frostschutz에게 감사드립니다).
% echo -n 'ABC' > t.txt
% recode -v UTF-8..JIS_X0208 t.txt
Request: UTF-8..:libiconv:..JIS_X0208
Shrunk to: UTF-8..JIS_X0208
Recoding t.txt... done
% recode -v JIS_X0208..UTF-8 t.txt
Request: JIS_X0208..:libiconv:..UTF-8
Shrunk to: JIS_X0208..UTF-8
Recoding t.txt... done
답변1
GNU는 recode
이를 지원하는 것 같습니다:
$ 기록 -l grep -i ISO-IR-87 JIS_X0208 csISO87JISX0208ISO-IR-87JIS0208 JISX0208.1983-0 JISX0208.1990-0 JIS_X0208-1983 JIS_X0208-1990 X0208
그래서:
recode ISO-IR-87..UTF-8
다른 이름도 많이 있는 것 같습니다(참조:https://en.wikipedia.org/wiki/JIS_X_0208또는 그 이상) 그러나 그 중 어느 것도 iconv
GNU libc에서 지원되지 않는 것 같습니다. Wikipedia 기사에서는 일본어 문자 집합이 올바르게 지정되지 않았고 구현 간 비호환성이 있으며 현재 사용되지 않는다고 제안합니다. 이는 GNU libc에 포함되지 않은 이유를 설명합니다(GNU의 독립 실행형 iconv 라이브러리에 포함되어 있음에도 불구하고, 표시된 대로). @) 프로스트 슈츠).