원으로 둘러싸인 숫자의 유니코드 범위(U+2460 .. U+2468)는 일본어 인코딩(EUC-JP, Shift-JIS, ISO-2022-JP)으로 변환하거나 일본어 인코딩에서 변환할 수 없습니다.거기에 존재하더라도, 나는 항상 그들을 만난다.
% echo ①②③③④⑤⑥⑦⑧⑨ | iconv -f utf-8 -t euc-jp
iconv: (stdin):1:0: cannot convert
% echo ①②③③④⑤⑥⑦⑧⑨ | iconv -f utf-8 -t shift-jis
iconv: (stdin):1:0: cannot convert
% echo ①②③③④⑤⑥⑦⑧⑨ | iconv -f utf-8 -t iso-2022-jp
iconv: (stdin):1:0: cannot convert
% printf "\xad\xa1\xad\xa2\xad\xa3\xad\xa3 \xad\xa4\xad\xa5\xad\xa6\xad\xa7\xad\xa8\xad\xa9" | iconv -f euc-jp -t utf-8
iconv: (stdin):1:0: cannot convert
% printf "\x87\x40\x87\x41\x87\x42\x87\x42 \x87\x43\x87\x44\x87\x45\x87\x46\x87\x47\x87\x48" | iconv -f shift-jis -t utf-8
iconv: (stdin):1:0: cannot convert
무엇을 제공합니까?
답변1
이러한 문자는 실제로 이 세 가지 인코딩에 존재하지 않습니다.실제로 일반 EUC-JP 대신 또는 일반 ISO-2022-JP 대신 SHIFT_JIS 대신 EUC-JIS-2004
일명을 원합니다 .EUC-JISX0213
SHIFT_JIS-2004
CP932
ISO-2022-JP-2004
% printf "\xad\xa1\xad\xa2\xad\xa3 \xad\xa4\xad\xa5\xad\xa6\xad\xa7\xad\xa8\xad\xa9" | iconv -f euc-jisx0213 -t utf-8
①②③ ④⑤⑥⑦⑧⑨