파일의 모든 고유 유니코드 문자와 그 수를 표로 만들 수 있는 도구를 아는 사람이 있습니까?
답변1
"유니코드 문자"가 정확히 무엇을 의미하는지 잘 모르겠습니다. 파일의 고유 문자 수를 계산하려면 다음을 수행할 수 있습니다.
$ awk -v FS="" -v OFS="\t" '{for(i=1;i<=NF;i++) char[$i]++} END { for(i in char) print i,char[i]}' input.txt
-v FS=""
필드 구분 기호를 공백으로 설정합니다 . 따라서 각 문자는 단일 필드로 처리됩니다. 각 행에서 문자를 목록의 키로 사용하여 필드를 반복하고 증분 단위로 계산합니다 ++
. 모든 줄을 읽으면 개수 목록을 반복하고 각 키(문자를 나타냄)와 해당 개수를 인쇄합니다.