awk: 첫 번째 열을 기준으로 정렬한 다음 두 번째 열만 출력하고 두 번째 열은 모두 출력합니다.

Question 1

원래 awk 솔루션이 제거되었습니다 - a더 나은 솔루션게시됨

실제로 입력을 미리 정렬한 다음 awk를 사용하여 형식을 지정할 수 있습니다.

sort twocol | awk 'BEGIN{OFS="\t"} {print $1 == last ? "" : $1, $2; last = $1}'
001     01
        02
        03
        11
002     01
        02
        03
        04
003     01
007     03
010     21
137     12
        94

이렇게 하면 탭으로 구분된 출력이 생성됩니다. 공백이 필요한 경우 결과를 파이프합니다 expand.

또는 익명 배열의 Perl 해시를 사용하여 두 번째 열 값을 집계한 다음 정렬하고 인쇄할 수 있습니다.

perl -alne '
  push @{ $h{$F[0]} }, $F[1] 
  }{ 
  foreach $k (sort {$a <=> $b} keys %h) {
    @a = sort {$a <=> $b} @{ $h{$k} };
    print join "\n", map { ($_ == 0 ? $k : "") . "\t" . $a[$_] } 0..$#a;
  }
  ' twocol
001     01
        02
        03
        11
002     01
        02
        03
        04
003     01
007     03
010     21
137     12
        94

{$a <=> $b}제로 패딩된 데이터를 사전식으로 정렬하는 것은 숫자로 정렬하는 것과 동일하므로 이러한 작업은 필요하지 않을 수 있습니다.

단지 재미로,밀러:

mlr -S --nidx --ofs tab put -q '
  @m[$1] = is_not_array(@m[$1]) ? [$2] : append(@m[$1],$2); 
  end { 
    @m = sort(apply(@m, func(k,v) { return {k: joinv(sort(v), "\n\t")}; }));
    emit @m, ""
  }
  ' twocol 
001     01
        02
        03
        11
002     01
        02
        03
        04
003     01
007     03
010     21
137     12
        94

Answer

원래 awk 솔루션이 제거되었습니다 - a더 나은 솔루션게시됨

실제로 입력을 미리 정렬한 다음 awk를 사용하여 형식을 지정할 수 있습니다.

sort twocol | awk 'BEGIN{OFS="\t"} {print $1 == last ? "" : $1, $2; last = $1}'
001     01
        02
        03
        11
002     01
        02
        03
        04
003     01
007     03
010     21
137     12
        94

이렇게 하면 탭으로 구분된 출력이 생성됩니다. 공백이 필요한 경우 결과를 파이프합니다 expand.

또는 익명 배열의 Perl 해시를 사용하여 두 번째 열 값을 집계한 다음 정렬하고 인쇄할 수 있습니다.

perl -alne '
  push @{ $h{$F[0]} }, $F[1] 
  }{ 
  foreach $k (sort {$a <=> $b} keys %h) {
    @a = sort {$a <=> $b} @{ $h{$k} };
    print join "\n", map { ($_ == 0 ? $k : "") . "\t" . $a[$_] } 0..$#a;
  }
  ' twocol
001     01
        02
        03
        11
002     01
        02
        03
        04
003     01
007     03
010     21
137     12
        94

{$a <=> $b}제로 패딩된 데이터를 사전식으로 정렬하는 것은 숫자로 정렬하는 것과 동일하므로 이러한 작업은 필요하지 않을 수 있습니다.

단지 재미로,밀러:

mlr -S --nidx --ofs tab put -q '
  @m[$1] = is_not_array(@m[$1]) ? [$2] : append(@m[$1],$2); 
  end { 
    @m = sort(apply(@m, func(k,v) { return {k: joinv(sort(v), "\n\t")}; }));
    emit @m, ""
  }
  ' twocol 
001     01
        02
        03
        11
002     01
        02
        03
        04
003     01
007     03
010     21
137     12
        94

Question 2

아이디어 awk:

awk '
BEGIN { OFS="\t"  }
      { a[$1][$2] }                               # we can sort on both indices to obtain the desired ordering
END   { PROCINFO["sorted_in"] = "@ind_num_asc"    # applies to all follow-on array references (ie, both indices of the a[] array)
        for (i in a) {
            firstcol = i
            for (j in a[i]) {
                print firstcol, j
                firstcol = ""
            }
         }
      }
' twocol

노트:이건 지원 이 GNU awk 4.0+필요해PROCINFO["sorted_in"]

그러면 다음이 생성됩니다.

PROCINFO["sorted_in"]사용할 수 없는 경우 sort이를 사용하여 단순화된 스크립트를 제공 할 수 있습니다 awk.

awk '
BEGIN { OFS="\t" }
      { if ($1 != prev1) {
           print $1,$2
           prev1 = $1
        }
        else
           print "",$2
      }
' < <(sort twocol)

이는 또한 다음을 생성합니다.

Answer

아이디어 awk:

awk '
BEGIN { OFS="\t"  }
      { a[$1][$2] }                               # we can sort on both indices to obtain the desired ordering
END   { PROCINFO["sorted_in"] = "@ind_num_asc"    # applies to all follow-on array references (ie, both indices of the a[] array)
        for (i in a) {
            firstcol = i
            for (j in a[i]) {
                print firstcol, j
                firstcol = ""
            }
         }
      }
' twocol

노트:이건 지원 이 GNU awk 4.0+필요해PROCINFO["sorted_in"]

그러면 다음이 생성됩니다.

PROCINFO["sorted_in"]사용할 수 없는 경우 sort이를 사용하여 단순화된 스크립트를 제공 할 수 있습니다 awk.

awk '
BEGIN { OFS="\t" }
      { if ($1 != prev1) {
           print $1,$2
           prev1 = $1
        }
        else
           print "",$2
      }
' < <(sort twocol)

이는 또한 다음을 생성합니다.

Question 3

사용행복하다(이전 Perl_6)

~$ raku -ne 'BEGIN my %h;  %h.append: .split(/ \s+ /);  END put .key => .value.sort.join("\n\t") for %h.sort;'  file

#OR

~$ raku -ne 'BEGIN my %h;  %h.append: .words;  END put .key => .value.sort.join("\n\t") for %h.sort;'  file

이것은 Perl 프로그래밍 언어 중 하나인 Raku로 작성된 답변입니다. 간단히 말해서, 위의 코드는 awk- 와 같은 작업을 수행하고 Raku(Perl과 같은)의 -ne비자동 인쇄 명령줄 플래그를 사용합니다.

해시 값은 %h블록으로 선언됩니다 BEGIN.
줄이 .split하나 이상의 \s공백 문자 위에 있습니다. 또는 (두 번째 답변) .words공백으로 분할하는 Raku의 루틴입니다. 두 답변 모두에서 결과(2개) 요소는 append해시로 컴파일되는 키-값 쌍으로 이해됩니다 .
END블록 내에서 %h해시 값( sort키에 포함)은 개별적으로 출력되며 put, 각 값 .key뒤에는 .value이미 존재하는 각 값이 옵니다 sort.join("\n\t"). 다음 행으로 넘어가는 값을 \t두 번째 열로 이동합니다.

입력 예:

예제 출력:

때로는 Raku의 기본값을 보는 것이 유익할 수 있으므로 위의 출력을 "열로 표시"하지 않은 답변은 다음과 같습니다(즉, 아래의 더 간단한 코드).

~$ raku -ne 'BEGIN my %h; %h.append: .words; END say .key => .value.sort for %h.sort;'  file
001 => (01 02 03 11)
002 => (01 02 03 04)
003 => (01)
007 => (03)
010 => (21)
137 => (12 94)

https://docs.raku.org/type/Hash
https://raku.org

Answer