en_US.UTF-8에 따른 잘못된 정렬

en_US.UTF-8에 따른 잘못된 정렬

en_US.UTF-8로 정렬할 때 sort 명령에 이상한 동작이 있음을 발견했습니다.

이 파일을 정렬하려고 합니다(LC_COLLATE=en_US.UTF-8 정렬 테스트 데이터).

㐃㐄

▼▽◢

kg㎜cm

양측

ㄠㄨㄩ─┃┆

◆□■Δ

ぁあぃい

┻╋┠┯┨

꓃꓄꓆꒺꒻

々—~”…”

불명예

답변1

정렬 후 영어 문자열이 반드시 다른 모든 문자열 앞에 오는 것을 원하지 않습니다. 나는 문자열이 먼저 언어 순서("mario" 이전의 "david")로 정렬된 다음 유니코드 코드 포인트 번호("프로그래머의 순서", 에 해당 LC_ALL=C) 로 정렬되기를 기대합니다.또는그냥 그대로 두세요(다른 문자열은 영어가 아니기 때문에).

내가 아는 한 man sort파일은/usr/lib/locale/en_US.UTF-8/LC_COLLATE ~해야 한다정렬 순서가 포함되어 있지만 영어 설치인데도 파일이 내 시스템에 없습니다. ( /usr/lib/locale/C.UTF-8/LC_COLLATE이것은 제가 정리한 유일한 파일입니다.)

관련 정보