세 파일의 정보를 결합하여 네 번째 파일을 만드는 방법은 무엇입니까?

Question

좋아, 이건 해킹이지만 어쨌든:

이 그룹을 다음과 같은 중간 파일로 사용 file3하고 구문 분석해 보겠습니다 .file2resolved

awk '
    FNR == NR {
        group = $1
        $1 = ""
        groups[group] = $0
    }
    FNR != NR {
        for (i = 2; i <= NF; i++) {
            print $i" "groups[$1]
        }
    }
' <(tail -n+2 file3) file2 > resolved

도착하다:

$ cat resolved
rs009  1 3 3 3
rs103  1 3 3 3
rs591  3 3 2 3
rs112  3 3 2 3
rs004  3 3 2 3

그런 다음 resolved다음과 함께 사용하십시오 file1.

awk '
    FNR == NR {
        group = $1;
        for (i = 2; i <= NF; i++) {
            groups[group][i] = $i
        }
    }
    FNR != NR {
        if ($1 in groups) {
            group = $1
        }
        for (i = 2; i <= NF; i++) {
            if (groups[group][i] != 3) {
                $i = 0
            }
        }
        print
    }

' resolved <(tail -n+2 file1)

다음을 생성합니다.

rs009 0 T A A
rs888 0 T T T
rs103 0 C C C
rs591 A A 0 A
rs112 A A 0 A
rs004 C C 0 C

헤더를 활용 column하고 다시 추가하면 됩니다.

Answer 1

좋아, 이건 해킹이지만 어쨌든:

이 그룹을 다음과 같은 중간 파일로 사용 file3하고 구문 분석해 보겠습니다 .file2resolved

awk '
    FNR == NR {
        group = $1
        $1 = ""
        groups[group] = $0
    }
    FNR != NR {
        for (i = 2; i <= NF; i++) {
            print $i" "groups[$1]
        }
    }
' <(tail -n+2 file3) file2 > resolved

도착하다:

$ cat resolved
rs009  1 3 3 3
rs103  1 3 3 3
rs591  3 3 2 3
rs112  3 3 2 3
rs004  3 3 2 3

그런 다음 resolved다음과 함께 사용하십시오 file1.

awk '
    FNR == NR {
        group = $1;
        for (i = 2; i <= NF; i++) {
            groups[group][i] = $i
        }
    }
    FNR != NR {
        if ($1 in groups) {
            group = $1
        }
        for (i = 2; i <= NF; i++) {
            if (groups[group][i] != 3) {
                $i = 0
            }
        }
        print
    }

' resolved <(tail -n+2 file1)

다음을 생성합니다.

rs009 0 T A A
rs888 0 T T T
rs103 0 C C C
rs591 A A 0 A
rs112 A A 0 A
rs004 C C 0 C

헤더를 활용 column하고 다시 추가하면 됩니다.

세 파일의 정보를 결합하여 네 번째 파일을 만드는 방법은 무엇입니까?

답변1

관련 정보