uniq가 유니코드와 문자가 하나만 있는 줄을 무시하는 이유는 무엇입니까?

Question

LC_COLLATE명령에만 설정하고 cat(사용하지 않음) sort및 에는 설정 해야 합니다 uniq.

또한 LC_CTYPEutf-8로 설정해야 할 수도 있습니다. 그렇지 않으면 혼란이 발생할 수 있습니다. 내가 설정할게LC_ALL도착하다en_US.UTF-8

uniq -u보고만고유한좋아요. 따라서 이러한 한 글자 단어가 여러 번 나타나면 나타나지 않는 것이 정상입니다.

내 시스템에서는무거운 검두 번 나타납니다.

$ cat american-english british-english | sort | grep -x 'épée'
épée
épée

아마도 당신은 sort | uniq또는 sort -u.

Answer 1

LC_COLLATE명령에만 설정하고 cat(사용하지 않음) sort및 에는 설정 해야 합니다 uniq.

또한 LC_CTYPEutf-8로 설정해야 할 수도 있습니다. 그렇지 않으면 혼란이 발생할 수 있습니다. 내가 설정할게LC_ALL도착하다en_US.UTF-8

uniq -u보고만고유한좋아요. 따라서 이러한 한 글자 단어가 여러 번 나타나면 나타나지 않는 것이 정상입니다.

내 시스템에서는무거운 검두 번 나타납니다.

$ cat american-english british-english | sort | grep -x 'épée'
épée
épée

아마도 당신은 sort | uniq또는 sort -u.

관련 정보