파일에서 단어 발생률을 찾는 방법

Question 1

다음과 같이 파일의 총 단어 수를 얻을 수 있습니다.

nw=`wc -w < /path/to/file`

단어/패턴의 발생 횟수

occurrences=`egrep -c <pattern> /path/to/file`

그런 다음 쉽게 백분율을 계산하고 결과를 변수에 넣을 수 있습니다.

result=`echo "scale=2; $occurrences*100/$nw" | bc`

추가하려면 예를 들어 %다음과 같이 할 수 있습니다. 다음과 같이 하세요

echo $result'%'

Answer

다음과 같이 파일의 총 단어 수를 얻을 수 있습니다.

nw=`wc -w < /path/to/file`

단어/패턴의 발생 횟수

occurrences=`egrep -c <pattern> /path/to/file`

그런 다음 쉽게 백분율을 계산하고 결과를 변수에 넣을 수 있습니다.

result=`echo "scale=2; $occurrences*100/$nw" | bc`

추가하려면 예를 들어 %다음과 같이 할 수 있습니다. 다음과 같이 하세요

echo $result'%'

Question 2

표시된 것과 동일한 논리를 사용하십시오.URL

tr ' ' '\n' < file.txt | awk '{if($0=="her"){nmw+=1}}END{print ((nmw*100)/NR)}'

Answer

표시된 것과 동일한 논리를 사용하십시오.URL

tr ' ' '\n' < file.txt | awk '{if($0=="her"){nmw+=1}}END{print ((nmw*100)/NR)}'

Question 3

그리고 awk:

awk -vw="word" 'BEGIN{RS="[^a-zA-Z]+"} $0==w{c++} END{printf "%.1f%%\n",c*100/NR}' file

Answer

그리고 awk:

awk -vw="word" 'BEGIN{RS="[^a-zA-Z]+"} $0==w{c++} END{printf "%.1f%%\n",c*100/NR}' file

관련 정보