첫 번째 행의 정보를 기반으로 여러 행을 그룹화하는 방법은 무엇입니까?

Question 1

이것은 awk 스크립트입니다. 5숫자만 변경하면 다른 그룹화를 수행할 수 있습니다 .

awk '
NR==1{
 previous = $1
 for(i = 1;i<=NF+1;i++)
  if($i!=previous){
    col[++numcol] = i
    previous = $i
  }
}
{ j = 1; start = 1
  for(i = 1;i<NF;i++){
   printf "%s",$i
   if(i==col[j]-1){printf "  "; start = col[j++]}
   else if((i-start+1)%5==0)printf "  "
  }
  printf "%s\n",$NF
}'

첫 번째 부분은 행 1만 처리하고 배열에 있는 각 동일한 숫자 집합의 시작 열을 수집합니다 col. 두 번째 부분은 시작 열의 5열이나 시퀀스 끝 부분을 제외하고 각 필드를 무제한으로 인쇄합니다.

Answer

이것은 awk 스크립트입니다. 5숫자만 변경하면 다른 그룹화를 수행할 수 있습니다 .

awk '
NR==1{
 previous = $1
 for(i = 1;i<=NF+1;i++)
  if($i!=previous){
    col[++numcol] = i
    previous = $i
  }
}
{ j = 1; start = 1
  for(i = 1;i<NF;i++){
   printf "%s",$i
   if(i==col[j]-1){printf "  "; start = col[j++]}
   else if((i-start+1)%5==0)printf "  "
  }
  printf "%s\n",$NF
}'

첫 번째 부분은 행 1만 처리하고 배열에 있는 각 동일한 숫자 집합의 시작 열을 수집합니다 col. 두 번째 부분은 시작 열의 5열이나 시퀀스 끝 부분을 제외하고 각 필드를 무제한으로 인쇄합니다.

Question 2

다른 변형앗

awk '
    NR==1{
        for(i=2;i<=NF;i++){
            count++
            if($(i-1)!=$i || count>4){
                D[i]=1
                count=0
            }
        }
     }
     {
        for(i in D)
            $i=" "$i
            print
     }
     ' OFS="" data.file >new.file

그리고sed

sed -re '
    s/ +//g;s/^/\n/
    ' -f <(
        sed -r '
            s/(. )\1*/s_\\n(&)_\n/g
            s/\S /./g
            s/\n\s*/\\1 \\n_\n/g
            s/\\n[^\n]*\n$/ \\n__/
            1q
        ' data.file
        ) -e '
    s/\S{5}/& /g
    ' data.file >new.file

Answer

다른 변형앗

awk '
    NR==1{
        for(i=2;i<=NF;i++){
            count++
            if($(i-1)!=$i || count>4){
                D[i]=1
                count=0
            }
        }
     }
     {
        for(i in D)
            $i=" "$i
            print
     }
     ' OFS="" data.file >new.file

그리고sed

sed -re '
    s/ +//g;s/^/\n/
    ' -f <(
        sed -r '
            s/(. )\1*/s_\\n(&)_\n/g
            s/\S /./g
            s/\n\s*/\\1 \\n_\n/g
            s/\\n[^\n]*\n$/ \\n__/
            1q
        ' data.file
        ) -e '
    s/\S{5}/& /g
    ' data.file >new.file

Question 3

한 가지 가능한 방법은 Perl을 사용하는 것입니다.짐 등에서 꺼내다파일의 첫 번째 줄에서 구성된 템플릿을 사용하는 함수입니다.

공백을 제거한 후 반복된 역참조가 포함된 정규식을 사용하여 동일한 문자의 가장 긴 연속 문자열을 찾고 maxwidth해당 위치를 배열에 저장합니다. 필드 너비는 배열의 인접한 요소를 빼서 추출되고 함수 A5A5A1A5A3A5A3에 전달될 양식의 적절한 템플릿 문자열에 매핑됩니다.unpack

#!/usr/bin/perl -l

use strict;
use warnings;

my $filename = shift or die "Usage: $0 FILENAME MAXWIDTH\n";
my $maxwidth = shift or die "Usage: $0 FILENAME MAXWIDTH\n";
open my $infile, $filename or die "Could not open $filename: $!";

my $n = $maxwidth-1;
my $template;

while( my $line = <$infile> )  { 
    $line =~ s/\s+//g;

    if ($. == 1) {
        my @ends = (0);
        while ($line =~ /(.)\g1{0,$n}/g) {
            push(@ends, pos $line);
        }
        my @fieldwidths = map $ends[$_] - $ends[$_-1], 1 .. $#ends;
        # http://stackoverflow.com/a/29821158/4440445
        $template =  join "", map { 'A' . $_ } @fieldwidths;
        # http://stackoverflow.com/a/2725663/4440445
    }

    my @fields = unpack($template, $line);
    print join " ", @fields;
}

close $infile;

Answer

한 가지 가능한 방법은 Perl을 사용하는 것입니다.짐 등에서 꺼내다파일의 첫 번째 줄에서 구성된 템플릿을 사용하는 함수입니다.

공백을 제거한 후 반복된 역참조가 포함된 정규식을 사용하여 동일한 문자의 가장 긴 연속 문자열을 찾고 maxwidth해당 위치를 배열에 저장합니다. 필드 너비는 배열의 인접한 요소를 빼서 추출되고 함수 A5A5A1A5A3A5A3에 전달될 양식의 적절한 템플릿 문자열에 매핑됩니다.unpack

#!/usr/bin/perl -l

use strict;
use warnings;

my $filename = shift or die "Usage: $0 FILENAME MAXWIDTH\n";
my $maxwidth = shift or die "Usage: $0 FILENAME MAXWIDTH\n";
open my $infile, $filename or die "Could not open $filename: $!";

my $n = $maxwidth-1;
my $template;

while( my $line = <$infile> )  { 
    $line =~ s/\s+//g;

    if ($. == 1) {
        my @ends = (0);
        while ($line =~ /(.)\g1{0,$n}/g) {
            push(@ends, pos $line);
        }
        my @fieldwidths = map $ends[$_] - $ends[$_-1], 1 .. $#ends;
        # http://stackoverflow.com/a/29821158/4440445
        $template =  join "", map { 'A' . $_ } @fieldwidths;
        # http://stackoverflow.com/a/2725663/4440445
    }

    my @fields = unpack($template, $line);
    print join " ", @fields;
}

close $infile;

첫 번째 행의 정보를 기반으로 여러 행을 그룹화하는 방법은 무엇입니까?

답변1

답변2

답변3

관련 정보