텍스트 파일에서 단어의 모든 반복 위치(단어 수 기준)

Question 1

GNU 도구를 사용하는 한 가지 방법은 다음과 같습니다.

$ tr ' ' '\n' < file | tr -d '[:punct:]' | grep . | grep -nFx iPhone
25:iPhone
54:iPhone
58:iPhone

첫 번째는 tr모든 공백을 개행 문자로 바꾼 다음 두 번째는 모든 구두점을 제거합니다(그래서 iPhone,단어로 찾을 수 있음). grep .빈 줄을 건너뛰고(이러한 줄은 계산하지 않음) grep -n출력에 줄 번호를 추가하세요 . 그런 다음 입력을 정규식으로 처리하지 말고 전체 줄에 걸쳐 있는 일치 항목만 찾아야 한다고 -F지시합니다 (그래서 일치 항목으로 간주되지 않습니다 ). 질문에 기재한 숫자에 한 자리가 누락되어 있습니다.grep-xjobjobs

숫자만 원하는 경우 다른 단계를 추가할 수 있습니다.

$ tr ' ' '\n' < file | tr -d '[:punct:]' | grep . | grep -nFx iPhone | cut -d: -f1
25
54
58

의견에서 지적했듯이 여기에는 여전히 aren'tor 와 같은 "단어" 문제가 있습니다 double-barreled. 다음을 사용하여 개선할 수 있습니다.

tr '[[:space:][:punct:]]' '\n' < file | grep . | grep -nFx iPhone

Answer

GNU 도구를 사용하는 한 가지 방법은 다음과 같습니다.

$ tr ' ' '\n' < file | tr -d '[:punct:]' | grep . | grep -nFx iPhone
25:iPhone
54:iPhone
58:iPhone

첫 번째는 tr모든 공백을 개행 문자로 바꾼 다음 두 번째는 모든 구두점을 제거합니다(그래서 iPhone,단어로 찾을 수 있음). grep .빈 줄을 건너뛰고(이러한 줄은 계산하지 않음) grep -n출력에 줄 번호를 추가하세요 . 그런 다음 입력을 정규식으로 처리하지 말고 전체 줄에 걸쳐 있는 일치 항목만 찾아야 한다고 -F지시합니다 (그래서 일치 항목으로 간주되지 않습니다 ). 질문에 기재한 숫자에 한 자리가 누락되어 있습니다.grep-xjobjobs

숫자만 원하는 경우 다른 단계를 추가할 수 있습니다.

$ tr ' ' '\n' < file | tr -d '[:punct:]' | grep . | grep -nFx iPhone | cut -d: -f1
25
54
58

의견에서 지적했듯이 여기에는 여전히 aren'tor 와 같은 "단어" 문제가 있습니다 double-barreled. 다음을 사용하여 개선할 수 있습니다.

tr '[[:space:][:punct:]]' '\n' < file | grep . | grep -nFx iPhone

Question 2

tr 명령을 사용하여 모든 공백을 단일 개행 문자로 바꿉니다(압착 옵션 사용).

이를 nl -ba에 파이프하면 각 줄(및 단어)에 순차적으로 번호가 매겨집니다.

원하는 단어를 얻으려면 grep -F로 파이프하십시오. 그러면 해당 단어의 수와 텍스트만 표시됩니다.

awk도 프로세스에서 이 작업을 수행하지만 더 복잡해 보일 수 있습니다.

Answer