CRLF 줄 종결자를 사용하여 ISO-8859 텍스트를 변경하는 방법

CRLF 줄 종결자를 사용하여 ISO-8859 텍스트를 변경하는 방법

텍스트 파일의 인코딩을 UTF-8로 변경하려고 합니다.

저는 Unix를 처음 접했기 때문에 도움이 될 것입니다. 재인코딩 기능을 사용하여 올바르게 인코딩하는 방법을 잘 모르겠습니다.

답변1

가장 간단한 방법은 아마도 사용하는 것입니다

사양의 하위 부분(-1…-9…-14…)이 필요할 수 있으므로 매뉴얼( iconv -f ISO88592 -t UTF8 < input.txt > output.txt)에 제안된 접근 방식은 ISO-8859에 대해 매개변수로 작동하지 않을 수 있지만... iconv는 자동으로 인식할 수 있어야 합니다. 인코딩 소스 파일. 그럼... 한번 시도해 보세요:

iconv -t UTF-8 yourfilename

게다가 현명한 조언으로마커스, dos와 같은 줄 끝을 *nix 표준(CR-LF -> LF)으로 변환하려면 다음을 사용할 수 있습니다.dos2unix. 배포판에 따라 일부 추가 패키지를 설치해야 할 수도 있습니다. 이로 인해 문제가 발생하는 경우 더 많은 표준 도구를 사용하여 CR을 제거할 수도 있습니다.

tr을 사용하세요:tr -d '\r' < yourfilename_withCRLF > yourfilename_LFonly

sed를 사용하세요:sed -i 's/\r$//g' youfilename_withCRLF

관련 정보