sed를 사용하여 문자 삭제

Question 1

현재 로케일이 이미 UTF-8을 문자 집합으로 사용하고 파일이 해당 문자 집합을 사용하여 작성된 경우:

<file LC_ALL=C sed 's/[^ -~]//g'

또는 AIX sed에 제어 문자를 포함하려면 다음을 수행하십시오.

<file LC_ALL=C sed "$(printf "s/[^[:print:]\t\r]//g")"

Answer

현재 로케일이 이미 UTF-8을 문자 집합으로 사용하고 파일이 해당 문자 집합을 사용하여 작성된 경우:

<file LC_ALL=C sed 's/[^ -~]//g'

또는 AIX sed에 제어 문자를 포함하려면 다음을 수행하십시오.

<file LC_ALL=C sed "$(printf "s/[^[:print:]\t\r]//g")"

Question 2

다음과 같이 명령을 사용할 수 있습니다 tr.

tr -cd '[:print:]\t\r\n'

설명하다:

`[:print:]'
Any character from the `[:space:]' class, and any character that is not in the `[:graph:]' class
\r -- return
\t -- horizontal tab

예 based on Centos 7:tris GNU and UTF-8 encoding

$ echo "fiancÃÂÃÂÃÂÃÂÃÂ" | tr -cd '[:print:]\t\r\n'
fianc

$ echo "get ^▒▒^▒▒^▒▒^▒▒^▒▒^▒▒ " | tr -cd '[:print:]\t\r\n'
get ^^^^^^

echo " Caucasian male lives in Arizona w/ fianc▒^▒▒^▒▒^▒▒^▒▒^▒▒^▒^▒▒^▒▒^▒▒^▒▒^▒▒^▒"  | tr -cd '[:print:]\t\r\n'
 Caucasian male lives in Arizona w/ fianc^^^^^^^^^^^^

Answer

다음과 같이 명령을 사용할 수 있습니다 tr.

tr -cd '[:print:]\t\r\n'

설명하다:

`[:print:]'
Any character from the `[:space:]' class, and any character that is not in the `[:graph:]' class
\r -- return
\t -- horizontal tab

예 based on Centos 7:tris GNU and UTF-8 encoding

$ echo "fiancÃÂÃÂÃÂÃÂÃÂ" | tr -cd '[:print:]\t\r\n'
fianc

$ echo "get ^▒▒^▒▒^▒▒^▒▒^▒▒^▒▒ " | tr -cd '[:print:]\t\r\n'
get ^^^^^^

echo " Caucasian male lives in Arizona w/ fianc▒^▒▒^▒▒^▒▒^▒▒^▒▒^▒^▒▒^▒▒^▒▒^▒▒^▒▒^▒"  | tr -cd '[:print:]\t\r\n'
 Caucasian male lives in Arizona w/ fianc^^^^^^^^^^^^

sed를 사용하여 문자 삭제

답변1

답변2

관련 정보