단락이 있고 모든 단락의 줄 시작 부분에 어떤 단어가 가장 많이 나타나는지 알고 싶습니다.
예: 단락:
Hello my name is X
Nice to meet you
Hello my name is Y
그래서 Hello가 2번 나타나므로 hello를 출력하겠습니다.
답변1
awk -v RS= '
{word = tolower($1); n = ++count[word]}
n > max {max_word = word; max = n}
END {print max_word}'
답변2
아래 명령은 개수와 함께 원하는 가장 많이 반복되는 단어를 제공합니다.
cut -d ' ' -f1 file.txt | sort | uniq -c | head -1
답변3
아래의 연관배열 방법을 사용해 보세요
awk 'NF{a[$1]++}END{for(x in a){print x" appears "a[x]}}' | sort -k3 -nr | sed -n '1p'
산출:
Hello appears 2
답변4
간단하지 않은 이유는 무엇입니까? awk '{ print $1 }' myfile |uniq -c