en_US.UTF-8로 정렬할 때 sort 명령에 이상한 동작이 있음을 발견했습니다.
이 파일을 정렬하려고 합니다(LC_COLLATE=en_US.UTF-8 정렬 테스트 데이터).
㐀
㐃㐄
▼▽◢
kg㎜cm
양측
ㄠㄨㄩ─┃┆
◆□■Δ
ぁあぃい
┻╋┠┯┨
꓃꓄꓆꒺꒻
々—~”…”
불명예
답변1
정렬 후 영어 문자열이 반드시 다른 모든 문자열 앞에 오는 것을 원하지 않습니다. 나는 문자열이 먼저 언어 순서("mario" 이전의 "david")로 정렬된 다음 유니코드 코드 포인트 번호("프로그래머의 순서", 에 해당 LC_ALL=C
) 로 정렬되기를 기대합니다.또는그냥 그대로 두세요(다른 문자열은 영어가 아니기 때문에).
내가 아는 한 man sort
파일은/usr/lib/locale/en_US.UTF-8/LC_COLLATE
~해야 한다정렬 순서가 포함되어 있지만 영어 설치인데도 파일이 내 시스템에 없습니다. ( /usr/lib/locale/C.UTF-8/LC_COLLATE
이것은 제가 정리한 유일한 파일입니다.)