유효하지 않은 문자가 포함된 파일 저장

Question

head아니면tail고정시키다/변화수치.

아마도 무슨 일이 일어나고 있는지는 gedit처음 몇 바이트를 기반으로 파일의 인코딩을 추측하려고 한다는 것입니다. 0xD4가 파일에서 멀리 떨어져 있으면 gedit파일이 ASCII 또는 UTF-8 형식이라고 추측하고 0xD4 바이트가 ASCII 또는 UTF-8 형식에서 유효하지 않은 것으로 발견되면 불평합니다.

두 번째 짧은 파일의 경우 0xD4가 파일 시작 부분에 가까우므로 gedit추측된 문자 집합은 일부 8비트 문자 집합입니다(아마도 iso8859-1, 여기서 0xD4는 Ô).

그래서 귀하의 :

head -n 449025 invalid.txt | tail > invalid_short.txt

방법이 정확합니다. 두 파일 모두에서 실행 하면 두 경우 모두 .with : sed -n l와 같은 내용이 표시됩니다 .003002002002\324Mhd30 30 33 30 30 32 30 30 32 30 30 32 d4 4d |003002002002.M|

Answer 1

head아니면tail고정시키다/변화수치.

아마도 무슨 일이 일어나고 있는지는 gedit처음 몇 바이트를 기반으로 파일의 인코딩을 추측하려고 한다는 것입니다. 0xD4가 파일에서 멀리 떨어져 있으면 gedit파일이 ASCII 또는 UTF-8 형식이라고 추측하고 0xD4 바이트가 ASCII 또는 UTF-8 형식에서 유효하지 않은 것으로 발견되면 불평합니다.

두 번째 짧은 파일의 경우 0xD4가 파일 시작 부분에 가까우므로 gedit추측된 문자 집합은 일부 8비트 문자 집합입니다(아마도 iso8859-1, 여기서 0xD4는 Ô).

그래서 귀하의 :

head -n 449025 invalid.txt | tail > invalid_short.txt

방법이 정확합니다. 두 파일 모두에서 실행 하면 두 경우 모두 .with : sed -n l와 같은 내용이 표시됩니다 .003002002002\324Mhd30 30 33 30 30 32 30 30 32 30 30 32 d4 4d |003002002002.M|

유효하지 않은 문자가 포함된 파일 저장

답변1

관련 정보