쉼표로 구분된 목록으로 개체 크기 요약을 만듭니다.

Question 1

$ awk '{ object[$1]= (object[$1]==""?"":object[$1] ",") $2 }
  END  { for(obj in object) print obj, object[obj] }' infile
A 1,2,9
B 4,3
C 5
ABC 12,6

좀 더 효율적으로(메모리를 사용하며 메모리에 맞지 않는 대용량 파일에 중요함) awk 명령만 사용하여 위와 같이 파일 부분을 버퍼링하지 않고 객체 키가 변경될 때까지만 버퍼링하는 것입니다.

$ <infile sort -k1,1 -k2,2n |\
  awk 'pre!=$1 { if(obj) { print obj; obj="" } }
               { obj= (obj==""?$1 " ":obj ",") $2; pre=$1 }
  END{ if(obj) print obj }'
A 1,2,9
ABC 6,12
B 3,4
C 5

Answer

$ awk '{ object[$1]= (object[$1]==""?"":object[$1] ",") $2 }
  END  { for(obj in object) print obj, object[obj] }' infile
A 1,2,9
B 4,3
C 5
ABC 12,6

좀 더 효율적으로(메모리를 사용하며 메모리에 맞지 않는 대용량 파일에 중요함) awk 명령만 사용하여 위와 같이 파일 부분을 버퍼링하지 않고 객체 키가 변경될 때까지만 버퍼링하는 것입니다.

$ <infile sort -k1,1 -k2,2n |\
  awk 'pre!=$1 { if(obj) { print obj; obj="" } }
               { obj= (obj==""?$1 " ":obj ",") $2; pre=$1 }
  END{ if(obj) print obj }'
A 1,2,9
ABC 6,12
B 3,4
C 5

Question 2

GNU 사용 datamash:

$ datamash -t ' ' -s -g 1 collapse 2 <file
A 1,2,9
ABC 12,6
B 4,3
C 5

옵션:

-t '_'필드 구분 기호로 공백 문자 사용
-s그룹화하기 전에 입력 정렬
-g 1첫 번째 필드의 그룹
collapse 2두 번째 필드의 값을 쉼표로 구분된 목록으로 축소합니다.

Answer

GNU 사용 datamash:

$ datamash -t ' ' -s -g 1 collapse 2 <file
A 1,2,9
ABC 12,6
B 4,3
C 5

옵션:

-t '_'필드 구분 기호로 공백 문자 사용
-s그룹화하기 전에 입력 정렬
-g 1첫 번째 필드의 그룹
collapse 2두 번째 필드의 값을 쉼표로 구분된 목록으로 축소합니다.

Question 3

정렬한 다음 GNU sed에 입력하면 현재 첫 번째 필드를 이전 필드와 비교하여 해당 지점까지 쉼표로 구분된 OR을 인쇄합니다.

$ < file sort -s -k1,1 \
| sed -Ee '
  :a
    $!N
    s/^((\S+)\s.*)\n\2\s+(\S+)/\1,\3/
  ta
  P;D
' -
A 1,2,9
ABC 12,6
B 4,3
C 5

Answer

정렬한 다음 GNU sed에 입력하면 현재 첫 번째 필드를 이전 필드와 비교하여 해당 지점까지 쉼표로 구분된 OR을 인쇄합니다.

$ < file sort -s -k1,1 \
| sed -Ee '
  :a
    $!N
    s/^((\S+)\s.*)\n\2\s+(\S+)/\1,\3/
  ta
  P;D
' -
A 1,2,9
ABC 12,6
B 4,3
C 5

쉼표로 구분된 목록으로 개체 크기 요약을 만듭니다.

답변1

답변2

답변3

관련 정보