두 가지 조건(열 기준 및 순서 기준)과 일치하는 항목을 찾습니다.

두 가지 조건(열 기준 및 순서 기준)과 일치하는 항목을 찾습니다.

아래와 같이 탭으로 구분된 파일이 있습니다. 첫 번째 열은 읽기 이름이고 세 번째 열은 읽기가 박테리아인지 진핵인지 여부를 지정합니다. 읽기당 항목/조회 횟수가 많을 수 있습니다. 그 내용을 발췌하고 싶습니다첫 번째 히트(행의 첫 번째 항목)는 박테리아입니다.

A00643:620:HFM7YDSX5:1:1101:9064:18223 LN590686.1 Eukaryota
A00643:620:HFM7YDSX5:1:1101:9064:18223 LN590686.1 Eukaryota
A00643:620:HFM7YDSX5:1:1101:9064:18223 LN590686.1 Eukaryota
A00643:620:HFM7YDSX5:1:1101:9064:18223 LN590686.1 Eukaryota
A00643:620:HFM7YDSX5:1:1101:9064:18223 LN590686.1 Eukaryota
A00643:620:HFM7YDSX5:1:1101:9064:18223 LN590686.1 Eukaryota
A00643:620:HFM7YDSX5:1:1101:9064:18223 LT700188.1 Bacteria
A00643:620:HFM7YDSX5:1:1101:9064:18223 LN598496.1 Eukaryota
A00643:620:HFM7YDSX5:1:1101:9064:18223 LN597789.1 Eukaryota
A00643:620:HFM7YDSX5:1:1101:9064:18223 LN596327.1 Eukaryota
A00643:620:HFM7YDSX5:1:1101:18258:19492 AL139347.10 Eukaryota
A00643:620:HFM7YDSX5:1:1101:31385:19554 LN600047.1 Eukaryota
A00643:620:HFM7YDSX5:1:1101:31385:19554 LN594833.1 Eukaryota
A00643:620:HFM7YDSX5:1:1101:31385:19554 LN590681.1 Eukaryota
A00643:620:HFM7YDSX5:1:1101:31385:19554 LN590681.1 Eukaryota
A00643:620:HFM7YDSX5:1:1101:31385:19554 LN590681.1 Eukaryota
A00643:620:HFM7YDSX5:1:1101:31385:19554 LN590681.1 Eukaryota
A00643:620:HFM7YDSX5:1:1101:31385:19554 LN590681.1 Eukaryota
A00643:620:HFM7YDSX5:1:1101:31385:19554 LN590681.1 Eukaryota
A00643:620:HFM7YDSX5:1:1101:31385:19554 LN590673.1 Eukaryota

A님 정말 감사드립니다.

답변1

내가 올바르게 이해했다면:

awk -F '\t' '!seen[$1]++ && $3 == "Bacteria"' < your-file

첫 번째 필드가 이전에 표시되지 않았고 세 번째 필드가 인 줄을 인쇄합니다 Bacteria.

관련 정보