Bash에서 파일의 리터럴 문자를 인쇄하는 방법은 무엇입니까?

Question

입력에는 문제가 없으며 read정상적으로 읽어야 합니다. 개행(newline) 문자는 이기 때문입니다 read. 이 read -d ''트릭을 사용하면 작동하게 됩니다.

echo $'\r' | { IFS= read -r -n1 x; echo "$x"|xxd; }          # CR
echo $'\n' | { IFS= read -r -n1 x; echo "$x"|xxd; }          # LF fails
echo $'\n' | { IFS= read -d '' -r -n1 x; echo "$x"|xxd; }    # LF ok

그러나 그들이 말했듯이 아마도 쉘에서는 그런 일을 하고 싶지 않을 것입니다. tr고정된 문자 집합을 제거하는 데 필요한 것이 바로 이것이지만, 적어도 GNU는 tr문자가 아닌 바이트로 작동하므로 유니코드에서는 많이 사용되지 않습니다.

내 생각에 이 Perl은 로케일이 UTF-8로 올바르게 설정된 경우 UTF-8 데이터에 대해 작동해야 한다고 생각합니다.

perl -C -pe 'tr/\x09\x0a\x0d\x20-\x{d7ff}\x{e000}-\x{fffd}\x{10000}-\x{10ffff}//cd' < in > out

하지만 테스트해 보는 것이 좋을 것 같습니다. 저는 유니코드 문제에 익숙하지 않습니다.

tr/abc//cdabc(에 나열되지 않은 문자를 제거하면 tr///실제로 문자가 다른 문자로 변환됩니다.perlop). 문자 목록과 범위를 허용하고 16진수 값으로 문자를 나타냅니다.\xHH헤헤, 그리고 귀중한\x{HHHH}하하하하. 따라서 위의 내용은 0x09, 0x0a, 0x0d, 등 0x20의 모든 것을 허용합니다.0xd7ff

위 목록은 질문에 제공된 목록에서 직접 가져온 것입니다. 이것이 변경되어야 하는지 여부는 최종 사용자에게 맡기겠습니다.

Answer 1