여러 ISO 인코딩, 즉 ISO-8859-6으로 인코딩된 문자와 ISO-8859-1로 인코딩된 일부 문자(ISO-8859-6에는 해당 문자가 없기 때문에)가 포함된 아랍어 파일이 있습니다. 전체 파일을 utf-8로 변환하고 싶습니다. 그래서 제가 시도한 것은 전체 파일을 .txt를 사용하여 ISO-8859-1로 변환 iconv -f ISO-8859-1 -t ISO-8859-1 fileip>fileop
한 다음 .txt를 사용하여 utf-8로 변환하는 것이었습니다 iconv -f ISO-8859-1 -t UTF-8 fileop>finalfile
. 그러나 결과는 여전히 UTF-8로 인코딩된 아랍어 문자가 아니라 이상한 문자일 뿐입니다. 인코딩을 통합하고 UTF-8 형식을 얻는 방법이 있습니까? 그렇지 않은 경우 utf-8 시스템에서는 작동하지 않으므로 sed를 사용하지 않고 ISO-8859-1을 어떻게 제거할 수 있습니까?
여러 ISO 인코딩이 포함된 파일
관련 정보
- 데비안은 Broadcom 무선(BCM43602)을 wlan0 인터페이스로 인식하지 않습니다.
- 명령 출력에서 줄 제거
- 정규식과 sed를 사용하여 찾기 및 바꾸기 [닫기]
- sed를 사용하여 매우 복잡한 표현식 관리
- /를 검색하고 \/로 바꾸세요.
- 다른 파일과 일치하는 줄을 찾아 별도의 파일에 저장
- CentOS 7에 Icedtea를 설치하는 데 문제가 있습니다.
- dnf는 yum을 통해 설치/업데이트된 모든 최신 데이터에서 작동합니까?
- 표준 버전 이상으로 Linux Mint에서 Xfce 업데이트
- Linux Philips 272s1mh/00의 웹캠으로 사용되는 Windows 카메라 |