여러 ISO 인코딩, 즉 ISO-8859-6으로 인코딩된 문자와 ISO-8859-1로 인코딩된 일부 문자(ISO-8859-6에는 해당 문자가 없기 때문에)가 포함된 아랍어 파일이 있습니다. 전체 파일을 utf-8로 변환하고 싶습니다. 그래서 제가 시도한 것은 전체 파일을 .txt를 사용하여 ISO-8859-1로 변환 iconv -f ISO-8859-1 -t ISO-8859-1 fileip>fileop
한 다음 .txt를 사용하여 utf-8로 변환하는 것이었습니다 iconv -f ISO-8859-1 -t UTF-8 fileop>finalfile
. 그러나 결과는 여전히 UTF-8로 인코딩된 아랍어 문자가 아니라 이상한 문자일 뿐입니다. 인코딩을 통합하고 UTF-8 형식을 얻는 방법이 있습니까? 그렇지 않은 경우 utf-8 시스템에서는 작동하지 않으므로 sed를 사용하지 않고 ISO-8859-1을 어떻게 제거할 수 있습니까?
여러 ISO 인코딩이 포함된 파일
관련 정보
- IPSec/L2TP VPN 연결 실패
- 리눅스 민트. 제목 표시줄 문자 누락
- 시작 시 GNU GRUB
- CentOS 7 linux-firmware - 어떻게 정리하나요?
- ps --sort: 24시간 이상 활성 프로세스를 나열합니다.
- Plasma의 데스크탑 링크에 기본 애플리케이션 아이콘을 추가하는 방법은 무엇입니까?
- 서버의 데이터베이스에 액세스할 때 두 사람이 있는지 확인하는 방법
- WSL/Ubuntu/Bash에서 두 개의 물결표 "~~"(또는 유사한 문자)를 사용하여 경로에 대한 바로 가기를 만드는 방법은 무엇입니까? [복사]
- 프로세스가 루트화되었는지 알 수 있는 방법이 있습니까?
- 간단한 C 프로그램을 실행하는 가상 머신을 실행하는 가장 쉬운 방법은 무엇입니까