하나의 텍스트 파일을 약 24개의 다른 텍스트 파일과 비교하고 일치하는 경우 각 줄의 특정 열을 인쇄하려면 어떻게 해야 합니까?

Question

글쎄요, 사실 제가 이 질문을 하는 것을 잊어버렸는데, 누군가 방금 이 게시물에 투표를 했고 제가 알아냈기 때문에 답변을 게시하겠습니다.

위에 나열된 첫 번째 출력 조각의 경우

10      10011300        10011301        T       C
10      10012494        10012495        G       A
10      10028691        10028692        A       T
10      10093496        10093497        G       A
10      10102457        10102458        C       T
10      10103252        10103253        G       C
10      10122271        10122272        T       C
10      10128778        10128779        T       C
10      10130299        10130300        C       A
10      10148307        10148308        G       A

내가 해야 할 일은 다음 awk 명령을 사용하는 것뿐입니다.

cat [inputfile.txt] | awk '{print $1"_"$3"\t"$4"\t"$5}' | sort -k1,1 > outputfileA.txt

출력은 다음과 같습니다. 모든 행은 첫 번째 열을 기준으로 정렬됩니다.

10_10011301        T       C
10_10012495        G       A
10_10028692        A       T
10_10093497        G       A

두 번째 코드 부분에서도 동일한 작업을 수행합니다.

1       10177   rs367896724
1       10235   rs540431307
1       10352   rs555500075
1       10505   rs548419688
1       10506   rs568405545

비슷한 awk 명령을 사용하여 다른 파일을 생성합니다.

cat [inputfile.txt] | awk '{print $1"_"$2"\t"$3}' | sort -k1,1 > outputfileB.txt

다음으로 이어진다:

1_10177   rs367896724
1_10235   rs540431307
1_10352   rs555500075
1_10505   rs548419688
1_10506   rs568405545

두 출력 파일 모두 하나의 열을 갖고 열의 순서가 동일하므로 Join 명령을 호출할 수 있습니다.

join -1 1 -2 2 outputfileA.txt outputfileB.txt | tr ' ' '\t' > outputfileC.txt

tr ' ' '\t'출력의 모든 공백을 탭으로 변환합니다. 첫 번째 파일의 첫 번째 열과 두 번째 파일의 첫 번째 열 사이에 동일하게 일치하는 모든 행이 출력 파일에 기록됩니다. 이는 다음과 같습니다.

1_101850899     A       C       rs138958619
1_101856556     T       C       rs191666242
1_101867058     C       T       rs188447998
1_101874381     A       C       rs143747209
1_101877269     G       A       rs186149522
1_101878704     C       A       rs192815769
1_101885657     G       T       rs150829467
1_101891797     T       G       rs141886478
1_101893793     T       A       rs182950692
1_101897192     T       C       rs189527356

내가 잘 설명했으면 좋겠다. 명확히 해야 할 사항이 있으면 알려주시기 바랍니다.

Answer 1