문자에서 악센트 표시 제거

문자에서 악센트 표시 제거

이 질문은 이전에 제기되고 답변된 적이 있다고 확신합니다. 그러나 특정 사용 사례에 대한 답변을 찾을 수 없습니다.

악센트 문자가 포함된 파일이 있습니다.

>  ~ cat file
ë
ê
Ý,text
Ò
É

각각의 악센트 없는 문자로 어떻게 변환합니까? 결과는 다음과 같습니다.

> ~ convert file out.txt
> ~ cat out.txt
e
e
Y,text
O
E

실제 파일 자체에는 더 많은 문자가 포함되어 있습니다.

답변1

(음역) 옵션을 iconv사용해 볼 수 있습니다.//TRANSLIT

전임자. 주어진

$ cat file
ë
ê
Ý,text
Ò
É

그 다음에

$ iconv -t ASCII//TRANSLIT file
e
e
Y,text
O
E

답변2

GNU recode 패키지는 문자 인코딩 간 변환에 유용하며 "플랫" 인코딩을 사용하여 이 작업을 수행하는 특별한 경우가 있습니다.

recode -f utf8..flat <textin.txt >flattext.out

관련 정보