Awk를 사용하여 텍스트의 단어 바이그램 식별 및 역방향

Question

이 시도,

sed -r -e "s:([A-Z][a-z]+)\s([A-Z][a-z]+):\2 \1:g" subfile > newsubfile

또는 원본 파일을 다음으로 변경할 수 있습니다.

sed -i -r -e "s:([A-Z][a-z]+)\s([A-Z][a-z]+):\2 \1:g" subfile

정규 표현식은 ([A-Z][a-z]+)\s([A-Z][a-z]+)대문자로 시작하는 연속된 두 단어를 선택하고 sed그 순서를 반대로 합니다. 이것이 모든 테스트 사례와 일치하는지 확인하세요. 몇 가지 테스트를 했는데 효과가 있었습니다.

Answer 1

이 시도,

sed -r -e "s:([A-Z][a-z]+)\s([A-Z][a-z]+):\2 \1:g" subfile > newsubfile

또는 원본 파일을 다음으로 변경할 수 있습니다.

sed -i -r -e "s:([A-Z][a-z]+)\s([A-Z][a-z]+):\2 \1:g" subfile

정규 표현식은 ([A-Z][a-z]+)\s([A-Z][a-z]+)대문자로 시작하는 연속된 두 단어를 선택하고 sed그 순서를 반대로 합니다. 이것이 모든 테스트 사례와 일치하는지 확인하세요. 몇 가지 테스트를 했는데 효과가 있었습니다.

관련 정보