저작권 기호 제거

저작권 기호 제거

명령줄에서 RSS 피드를 구문 분석하려고 합니다. 지금까지 코드는 작동하지만 피드에 저작권 기호가 포함되어 있는데 이를 제거하려고 했습니다(latin1로 인코딩되었습니다). Maybe를 사용하여 저작권 기호( \xA9) 를 제거하는 방법은 무엇입니까 sed?

답변1

이것이 유일한 문제라면 @Kevin의 의견에 동의합니다. 전체 피드가 UTF-8이 아닌 경우 tr -cd SETSET에 없는 모든 문자를 제거하거나 iconv -f (encoding) -t utf-8피드의 인코딩을 알고 있는 경우 고려할 수 있습니다.

답변2

tr -d '©'간단하게 삭제할 수 있습니다.

문자열로 바꾸려면 다음을 사용할 수 있습니다.

sed 's/©/(c)/g'

관련 정보