다음 형식의 2개 열이 있는 긴 csv 파일이 있습니다.
RG_cne_1| 0.316571
RG_cne_10| 0.26924
RG_cne_100| 0.227538
RG_cne_1000| 0.385216
RG_cne_1001| 0.247508
RG_cne_1002| 0.496622
RG_cne_1003| 0.445685
RG_cne_1004| 0.53264
RG_cne_1005| 0.433687
RG_cne_1006| 0.295209
RG_cne_1007| 0.432938
RG_cne_1008| 0.368191
RG_cne_1009| 0.40916
RG_cne_101| 0.291027
RG_cne_1010| 0.389481
RG_cne_1011| 0.401816
RG_cne_1에서 마지막 파일(RG_cne_1011)까지 첫 번째 열 이름을 기준으로 다음 형식으로 데이터를 정렬(행 순서 변경)해야 합니다.
RG_cne_1| its value
RG_cne_2| its value
RG_cne_3| its value
RG_cne_4| its value
RG_cne_5| its value
...
RG_cne_1011| its value
내 Mac에서는 다음을 사용해 보았습니다.
LC_ALL=C sort -t'|' -k1,1g
그러나 이로 인해 잘못된 숫자 순서가 생성됩니다(위에 표시된 것과 유사: 1, 10, 100 등).
답변1
일반화된 숫자 정렬( g
)에는 여전히 정렬 필드가 숫자로 시작해야 하며, 그렇지 않으면 문자열 비교를 사용하여 대체됩니다.
다음은 세 번째 구분 필드를 _
숫자로 정렬 한다고 가정합니다.
$ sort -t '_' -k 3,3n file
RG_cne_1| 0.316571
RG_cne_10| 0.26924
RG_cne_100| 0.227538
RG_cne_101| 0.291027
RG_cne_1000| 0.385216
RG_cne_1001| 0.247508
RG_cne_1002| 0.496622
RG_cne_1003| 0.445685
RG_cne_1004| 0.53264
RG_cne_1005| 0.433687
RG_cne_1006| 0.295209
RG_cne_1007| 0.432938
RG_cne_1008| 0.368191
RG_cne_1009| 0.40916
RG_cne_1010| 0.389481
RG_cne_1011| 0.401816