파일에서 동일한 문자가 두 개 이상 연속된 단어를 제거합니다.

파일에서 동일한 문자가 두 개 이상 연속된 단어를 제거합니다.

다음과 같은 단어 목록이 있습니다.

word
letter
linux
tagggs

letter나는 그것에서 and를 제거하고 싶습니다 tagggs. 왜냐하면 두 개 이상의 동일한 문자가 연속적으로 있기 때문입니다. 아마도 sed를 사용하여 이 작업을 수행할 수 있을까요?

답변1

역참조를 지원하는 정규식 도구 중 하나를 사용할 수 있습니다.

sed '/\(.\)\1/d' file

grep -v '\(.\)\1' file

반복되는 문자가 아닌 반복되는 문자로 제한하려면 로 변경하세요 ..[[:alpha:]]

관련 정보