2개의 파일을 비교하여 일치하지 않는 레코드의 줄 번호와 일치하지 않는 각 레코드의 열 번호를 TEST2.txt에 인쇄합니다.

Question

서툴지만 효과적이다:

BEGIN {
    FS=OFS="\t"
}

NR==FNR {
# 5 = number of columns
    for (i=0;i<=5;i++) {
        a[$1,i]=$i }
    }

{ if ( a[$1,0] != $0 ) {
    b=""
    for (i=1;i<=5;i++) {
        if ( a[$1,i] != $i ) {
            b=b i", "
            }
        }
    print "Line No." FNR," Column No. ",b
    }
}

그러나 이를 위해 (예를 들어) FORTRAN 프로그램을 작성하는 것이 좋습니다. 예를 들어 10,000행과 같은 대량의 데이터를 읽을 수 있고 awk이 솔루션을 사용하려면 RAM에 하나 이상의 파일을 저장해야 하는데 이는 GB 크기에 문제가 될 수 있습니다. 파일. 다음과 같이 보일 수 있습니다:

각 파일의 데이터 청크를 배열(행 및 열)로 읽습니다.
배열을 비교하고 a(i,j)=b(i,j)의 결과를 사용하여 논리 배열을 만듭니다.
출력을 생성하기 위해 논리 배열을 사용합니다.
출력을 인쇄하고 다음 블록을 읽습니다.

파일이 정렬되어 있고 모든 줄이 포함되어 있으므로 매우 간단합니다.

Answer 1

서툴지만 효과적이다:

BEGIN {
    FS=OFS="\t"
}

NR==FNR {
# 5 = number of columns
    for (i=0;i<=5;i++) {
        a[$1,i]=$i }
    }

{ if ( a[$1,0] != $0 ) {
    b=""
    for (i=1;i<=5;i++) {
        if ( a[$1,i] != $i ) {
            b=b i", "
            }
        }
    print "Line No." FNR," Column No. ",b
    }
}

그러나 이를 위해 (예를 들어) FORTRAN 프로그램을 작성하는 것이 좋습니다. 예를 들어 10,000행과 같은 대량의 데이터를 읽을 수 있고 awk이 솔루션을 사용하려면 RAM에 하나 이상의 파일을 저장해야 하는데 이는 GB 크기에 문제가 될 수 있습니다. 파일. 다음과 같이 보일 수 있습니다:

각 파일의 데이터 청크를 배열(행 및 열)로 읽습니다.
배열을 비교하고 a(i,j)=b(i,j)의 결과를 사용하여 논리 배열을 만듭니다.
출력을 생성하기 위해 논리 배열을 사용합니다.
출력을 인쇄하고 다음 블록을 읽습니다.

파일이 정렬되어 있고 모든 줄이 포함되어 있으므로 매우 간단합니다.

2개의 파일을 비교하여 일치하지 않는 레코드의 줄 번호와 일치하지 않는 각 레코드의 열 번호를 TEST2.txt에 인쇄합니다.

답변1

관련 정보