정렬 cmd 플래그 -f를 사용하는 de_DE.UTF-8 로케일의 예기치 않은 정렬 순서

정렬 cmd 플래그 -f를 사용하는 de_DE.UTF-8 로케일의 예기치 않은 정렬 순서

다음 환경에서 정렬하는 경우:

$ uname -a
Linux srap12dxR1 3.12.28-4-default #1 SMP Thu Sep 25 17:02:34 UTC 2014 (9879bd4) x86_64 x86_64 x86_64 GNU/Linux
$ env | egrep 'LANG|LC'
LC_COLLATE=de_DE.UTF-8
LC_CTYPE=de_DE.UTF-8

다음 UTF-8 인코딩 파일:

$ cat sort_me 
¬B
b
Ä
D
X
ä
C
c
A
a
$ od -c sort_me 
0000000 302 254   B  \n   b  \n 303 204  \n   D  \n   X  \n 303 244  \n
0000020   C  \n   c  \n   A  \n   a  \n

사용-에프플래그(대문자로 축소) 다음을 얻습니다.

A
a
b
C
c
D
X
¬B
Ä
ä

즉, 문자영형무시되지 않으며 독일어 움라우트아 아마지막에 배치됩니다.

로고를 사용하지 마세요-에프출력이 부분적으로 정확합니다.

$ sort sort_me
a
A
ä
Ä
b
¬B
c
C
D
X

즉, 문자영형무시하고ØB문자로 정렬두번째, 그러나 독일어 분음 부호는 Wiki에서 말하는 것처럼 일반 문자로 처리되지 않는 이유는 다음과 같습니다.

https://en.wikipedia.org/wiki/Alphabetical_order "... 움라우트가 있는 독일어 문자(ä, Ö, Ü)는 일반적으로 움라우트가 아닌 버전처럼 취급됩니다..."

관련 정보