![파일의 모든 고유 유니코드 문자와 해당 문자를 표시할 수 있는 빠른 도구가 있습니까?](https://linux55.com/image/146758/%ED%8C%8C%EC%9D%BC%EC%9D%98%20%EB%AA%A8%EB%93%A0%20%EA%B3%A0%EC%9C%A0%20%EC%9C%A0%EB%8B%88%EC%BD%94%EB%93%9C%20%EB%AC%B8%EC%9E%90%EC%99%80%20%ED%95%B4%EB%8B%B9%20%EB%AC%B8%EC%9E%90%EB%A5%BC%20%ED%91%9C%EC%8B%9C%ED%95%A0%20%EC%88%98%20%EC%9E%88%EB%8A%94%20%EB%B9%A0%EB%A5%B8%20%EB%8F%84%EA%B5%AC%EA%B0%80%20%EC%9E%88%EC%8A%B5%EB%8B%88%EA%B9%8C%3F.png)
파일의 모든 고유 유니코드 문자와 그 수를 표로 만들 수 있는 도구를 아는 사람이 있습니까?
답변1
"유니코드 문자"가 정확히 무엇을 의미하는지 잘 모르겠습니다. 파일의 고유 문자 수를 계산하려면 다음을 수행할 수 있습니다.
$ awk -v FS="" -v OFS="\t" '{for(i=1;i<=NF;i++) char[$i]++} END { for(i in char) print i,char[i]}' input.txt
-v FS=""
필드 구분 기호를 공백으로 설정합니다 . 따라서 각 문자는 단일 필드로 처리됩니다. 각 행에서 문자를 목록의 키로 사용하여 필드를 반복하고 증분 단위로 계산합니다 ++
. 모든 줄을 읽으면 개수 목록을 반복하고 각 키(문자를 나타냄)와 해당 개수를 인쇄합니다.