cat -v를 사용하여 볼 수 있는 파일에서 보이지 않는 정크 문자를 제거하려고 합니다. Google에서 다음 스크립트를 찾았지만 다음 명령이 어떻게 작동하는지 알고 싶습니다.
tr -cd '\11\12\40-\176' < Actual_file.txt > Actual_clean.txt
감사해요.
답변1
천천히 쓰는 방법이에요tr -cd '\t\n -~' ...
-c
추가 및 -d
삭제를 나타냅니다. 이렇게 하면 탭, 줄 바꿈 및 공백으로 시작하고 물결표로 끝나는 ASCII 인쇄 가능 문자를 제외한 모든 문자가 제거됩니다. man ascii(7)을 참조하세요.
또한 최신 Unix 시스템에서 많이 사용되는 인쇄 가능한 UTF-8 문자를 제거하므로 약간 과잉입니다.