Bash 및 AWK를 사용하여 텍스트 파일 비교

Question 1

그러면 두 파일 모두에 이름이 존재하지만 값이 다른 file2의 행이 출력됩니다.

awk 'NR==FNR {f1[$1]=$0; next} $1 in f1 && $0 != f1[$1]' file1.txt file2.txt

row2  1     4     11        
row1  2     5     12

공백의 차이조차도 잘못된 결과를 낳을 수 있다는 것을 깨달았습니다. 다음 줄을 "정규화"할 수 있습니다.

awk '
    NR==FNR  {$1=$1; f1[$1]=$0; next} 
    $1 in f1 {$1=$1; if ($0 != f1[$1]) print}
' file1.txt file2.txt

row2 1 4 11
row1 2 5 12

Answer

그러면 두 파일 모두에 이름이 존재하지만 값이 다른 file2의 행이 출력됩니다.

awk 'NR==FNR {f1[$1]=$0; next} $1 in f1 && $0 != f1[$1]' file1.txt file2.txt

row2  1     4     11        
row1  2     5     12

공백의 차이조차도 잘못된 결과를 낳을 수 있다는 것을 깨달았습니다. 다음 줄을 "정규화"할 수 있습니다.

awk '
    NR==FNR  {$1=$1; f1[$1]=$0; next} 
    $1 in f1 {$1=$1; if ($0 != f1[$1]) print}
' file1.txt file2.txt

row2 1 4 11
row1 2 5 12

Question 2

gawk 4.x이를 수행하는 방법에는 여러 가지가 있습니다 . 해결책은 다음과 같습니다 .

$ awk '
    FNR < 2 { next }
    FNR == NR {
        for (i = 2; i <= NF; i++) {
            a[$1][i] = $i;
        }
        next;
    }
    ($1 in a) {
      for (i = 2; i <= NF; i++) {
          if (a[$1][i] == $i) {
              printf("%s->Col%d: Equal\n", $1, i-1);
          } else {
              printf("%s->Col%d: Not Equal\n", $1, i-1);
          }
       }
  }
' file1.txt file2.txt
row2->Col1: Not Equal
row2->Col2: Not Equal
row2->Col3: Not Equal
row1->Col1: Not Equal
row1->Col2: Not Equal
row1->Col3: Not Equal

설명하다

FNR < 2 { next }: 처음 두 줄을 건너뜁니다.
FNR == NR: 첫 번째 파일을 처리하는 경우에만 true입니다. 각 열 값을 연관 배열 a형식으로 저장합니다 a[ROW][COLUMN].
($1 in a): file2의 행이 file1에 존재하는지 확인합니다. true인 경우 모든 열 값을 반복하여 file1의 값과 비교합니다.

이전 gawk버전의 경우 다음을 시도해 볼 수 있습니다.

$ awk '
    FNR < 2 { next }
    FNR == NR {
        for (i = 2; i <= NF; i++) {
            a[i,$1] = $i;
            b[$1];
        }
        next;
    }
    ($1 in b) {
      for (i = 2; i <= NF; i++) {
          if (a[i,$1] == $i) {
              printf("%s->Col%d: Equal\n", $1, i-1);
          } else {
              printf("%s->Col%d: Not Equal\n", $1, i-1);
          }
       }
  }
' file1.txt file2.txt

Answer

gawk 4.x이를 수행하는 방법에는 여러 가지가 있습니다 . 해결책은 다음과 같습니다 .

$ awk '
    FNR < 2 { next }
    FNR == NR {
        for (i = 2; i <= NF; i++) {
            a[$1][i] = $i;
        }
        next;
    }
    ($1 in a) {
      for (i = 2; i <= NF; i++) {
          if (a[$1][i] == $i) {
              printf("%s->Col%d: Equal\n", $1, i-1);
          } else {
              printf("%s->Col%d: Not Equal\n", $1, i-1);
          }
       }
  }
' file1.txt file2.txt
row2->Col1: Not Equal
row2->Col2: Not Equal
row2->Col3: Not Equal
row1->Col1: Not Equal
row1->Col2: Not Equal
row1->Col3: Not Equal

설명하다

FNR < 2 { next }: 처음 두 줄을 건너뜁니다.
FNR == NR: 첫 번째 파일을 처리하는 경우에만 true입니다. 각 열 값을 연관 배열 a형식으로 저장합니다 a[ROW][COLUMN].
($1 in a): file2의 행이 file1에 존재하는지 확인합니다. true인 경우 모든 열 값을 반복하여 file1의 값과 비교합니다.

이전 gawk버전의 경우 다음을 시도해 볼 수 있습니다.

$ awk '
    FNR < 2 { next }
    FNR == NR {
        for (i = 2; i <= NF; i++) {
            a[i,$1] = $i;
            b[$1];
        }
        next;
    }
    ($1 in b) {
      for (i = 2; i <= NF; i++) {
          if (a[i,$1] == $i) {
              printf("%s->Col%d: Equal\n", $1, i-1);
          } else {
              printf("%s->Col%d: Not Equal\n", $1, i-1);
          }
       }
  }
' file1.txt file2.txt

Question 3

for 루프 내에서 다음을 시도해 보세요.

awk ' {
      if(i == j)
           print "Same value";
      else
           print "Not the same";
       }'

다음은 도움이 될 수 있는 간단한 조건문이지만 두 개의 서로 다른 텍스트 파일을 비교하여 추가 조정이 필요할 수 있습니다.

Answer

for 루프 내에서 다음을 시도해 보세요.

awk ' {
      if(i == j)
           print "Same value";
      else
           print "Not the same";
       }'

다음은 도움이 될 수 있는 간단한 조건문이지만 두 개의 서로 다른 텍스트 파일을 비교하여 추가 조정이 필요할 수 있습니다.

Bash 및 AWK를 사용하여 텍스트 파일 비교

답변1

답변2

답변3

관련 정보