문서에서 각 단어의 발생 횟수를 가져옵니다.

Question 1

이 시도:

grep -o '\w*' doc.txt | sort | uniq -c | sort -nr

-o일치하는 줄 대신 각 일치 항목을 인쇄합니다.
\w*단어 문자 일치
sort파이프로 연결하기 전에 일치 항목을 정렬하세요 uniq.
uniq -c고유한 줄과 발생 횟수를 인쇄합니다.-c
sort -nr발생 횟수를 기준으로 역순으로 정렬합니다.

산출:

  2 word
  1 third
  1 second
  1 really

선택하다:

awk정확한 출력을 위해 :

$ grep -o '\w*' doc.txt \
| awk '{seen[$0]++} END{for(s in seen){print s,seen[s]}}' \
| sort -k2r

word 2
really 1
second 1
third 1

Answer

이 시도:

grep -o '\w*' doc.txt | sort | uniq -c | sort -nr

-o일치하는 줄 대신 각 일치 항목을 인쇄합니다.
\w*단어 문자 일치
sort파이프로 연결하기 전에 일치 항목을 정렬하세요 uniq.
uniq -c고유한 줄과 발생 횟수를 인쇄합니다.-c
sort -nr발생 횟수를 기준으로 역순으로 정렬합니다.

산출:

  2 word
  1 third
  1 second
  1 really

선택하다:

awk정확한 출력을 위해 :

$ grep -o '\w*' doc.txt \
| awk '{seen[$0]++} END{for(s in seen){print s,seen[s]}}' \
| sort -k2r

word 2
really 1
second 1
third 1

Question 2

perl -lnE '
  $count{$_}++ for /[[:alpha:]]+/g;
  END {
    say "@$_" for
      sort {$b->[1] <=> $a->[1] || $a->[0] cmp $b->[0]}
      map {[$_, $count{$_}]}
      keys %count
  }
' doc.txt

이는 pLumo의 초기 솔루션보다 더 많은 메모리를 소비합니다.

Answer

perl -lnE '
  $count{$_}++ for /[[:alpha:]]+/g;
  END {
    say "@$_" for
      sort {$b->[1] <=> $a->[1] || $a->[0] cmp $b->[0]}
      map {[$_, $count{$_}]}
      keys %count
  }
' doc.txt

이는 pLumo의 초기 솔루션보다 더 많은 메모리를 소비합니다.

문서에서 각 단어의 발생 횟수를 가져옵니다.

답변1

답변2

관련 정보