5개의 열을 사용하여 파일의 하위 집합 추출

Question 1

awk를 사용하십시오.

awk '
    { key = $1 FS $2 FS $3 FS $4 FS $5 }
    NR==FNR { a[key]; next }
    key in a
' file2 file1

Answer

awk를 사용하십시오.

awk '
    { key = $1 FS $2 FS $3 FS $4 FS $5 }
    NR==FNR { a[key]; next }
    key in a
' file2 file1

Question 2

두 파일이 모두 TSV 파일, 즉 탭으로 구분된 파일이라고 가정하면 다음을 사용할 수 있습니다.밀러( mlr; 구조화된 데이터 작업을 위해 특별히 개발된 도구)는 언급한 5개 필드를 사용하여 두 데이터 세트 간의 관계형 INNER JOIN 작업을 수행합니다.

$ mlr --tsv join -f firstfile -j '#CHROM,POS,ID,REF,ALT' secondfile
#CHROM  POS     ID      REF     ALT     QUAL    INFO
chr2    32424454        rs4576493       T       G       pass    ......
chr8    35578788        rs3686678       C       CCG     pass    .........

데이터가 단일 탭 대신 여러 공백을 사용하는 경우 입력과 출력이 모두 "예쁘게 인쇄"되기를 원함을 나타내기 --pprint위해 대신 사용하십시오. (또는 및 )를 --tsv사용하여 입력을 "예쁜 인쇄" 형식으로 읽고 출력을 TSV로 씁니다.--p2t--ipprint--otsv

Answer

두 파일이 모두 TSV 파일, 즉 탭으로 구분된 파일이라고 가정하면 다음을 사용할 수 있습니다.밀러( mlr; 구조화된 데이터 작업을 위해 특별히 개발된 도구)는 언급한 5개 필드를 사용하여 두 데이터 세트 간의 관계형 INNER JOIN 작업을 수행합니다.

$ mlr --tsv join -f firstfile -j '#CHROM,POS,ID,REF,ALT' secondfile
#CHROM  POS     ID      REF     ALT     QUAL    INFO
chr2    32424454        rs4576493       T       G       pass    ......
chr8    35578788        rs3686678       C       CCG     pass    .........

데이터가 단일 탭 대신 여러 공백을 사용하는 경우 입력과 출력이 모두 "예쁘게 인쇄"되기를 원함을 나타내기 --pprint위해 대신 사용하십시오. (또는 및 )를 --tsv사용하여 입력을 "예쁜 인쇄" 형식으로 읽고 출력을 TSV로 씁니다.--p2t--ipprint--otsv

5개의 열을 사용하여 파일의 하위 집합 추출

답변1

답변2

관련 정보