이 질문은 이전에 제기되고 답변된 적이 있다고 확신합니다. 그러나 특정 사용 사례에 대한 답변을 찾을 수 없습니다.
악센트 문자가 포함된 파일이 있습니다.
> ~ cat file
ë
ê
Ý,text
Ò
É
각각의 악센트 없는 문자로 어떻게 변환합니까? 결과는 다음과 같습니다.
> ~ convert file out.txt
> ~ cat out.txt
e
e
Y,text
O
E
실제 파일 자체에는 더 많은 문자가 포함되어 있습니다.
답변1
(음역) 옵션을 iconv
사용해 볼 수 있습니다.//TRANSLIT
전임자. 주어진
$ cat file
ë
ê
Ý,text
Ò
É
그 다음에
$ iconv -t ASCII//TRANSLIT file
e
e
Y,text
O
E
답변2
GNU recode 패키지는 문자 인코딩 간 변환에 유용하며 "플랫" 인코딩을 사용하여 이 작업을 수행하는 특별한 경우가 있습니다.
recode -f utf8..flat <textin.txt >flattext.out