전체 단락의 줄 시작 부분에 가장 자주 나타나는 단어를 찾으십시오.

전체 단락의 줄 시작 부분에 가장 자주 나타나는 단어를 찾으십시오.

단락이 있고 모든 단락의 줄 시작 부분에 어떤 단어가 가장 많이 나타나는지 알고 싶습니다.

예: 단락:

Hello my name is X

Nice to meet you

Hello my name is Y

그래서 Hello가 2번 나타나므로 hello를 출력하겠습니다.

답변1

awk -v RS= '
  {word = tolower($1); n = ++count[word]}
  n > max {max_word = word; max = n}
  END {print max_word}'

답변2

아래 명령은 개수와 함께 원하는 가장 많이 반복되는 단어를 제공합니다.

cut -d ' ' -f1 file.txt | sort | uniq -c | head -1

답변3

아래의 연관배열 방법을 사용해 보세요

awk 'NF{a[$1]++}END{for(x in a){print x" appears "a[x]}}' | sort -k3 -nr | sed -n '1p'

산출:

Hello appears 2

답변4

간단하지 않은 이유는 무엇입니까? awk '{ print $1 }' myfile |uniq -c

관련 정보