awk를 사용하여 일치하는 데이터를 선택하고 추출하는 방법은 무엇입니까?

Question

당신의 유전자 이름 목록은 DOS 텍스트 파일이군요, 그렇죠? 이는 각 유전자 이름 끝에 추가 캐리지 리턴이 있음을 의미합니다. 이는 파일 간에 이름이 일치하지 않음을 의미합니다. 이는 출력이 비어 있음을 의미합니다.

.dll을 사용하여 유전자 목록을 Unix 텍스트 파일로 변환합니다 dos2unix. 그런 다음 코드를 사용하십시오무루님이 댓글을 남겨주셨네요(두 번째 파일이 탭으로 구분되어 있다고 가정):

awk -v OFS='\t' 'FNR == NR {a[$0]++; next}; $2 in a {print $2, $29}' file1 file2 >file3

또는 awk각 줄 끝에서 캐리지 리턴을 제거합니다.

awk -v OFS='\t' '{ sub("\r$", "") } FNR == NR {a[$0]++; next}; $2 in a {print $2, $29}' file1 file2 >file3

Answer 1

당신의 유전자 이름 목록은 DOS 텍스트 파일이군요, 그렇죠? 이는 각 유전자 이름 끝에 추가 캐리지 리턴이 있음을 의미합니다. 이는 파일 간에 이름이 일치하지 않음을 의미합니다. 이는 출력이 비어 있음을 의미합니다.

.dll을 사용하여 유전자 목록을 Unix 텍스트 파일로 변환합니다 dos2unix. 그런 다음 코드를 사용하십시오무루님이 댓글을 남겨주셨네요(두 번째 파일이 탭으로 구분되어 있다고 가정):

awk -v OFS='\t' 'FNR == NR {a[$0]++; next}; $2 in a {print $2, $29}' file1 file2 >file3

또는 awk각 줄 끝에서 캐리지 리턴을 제거합니다.

awk -v OFS='\t' '{ sub("\r$", "") } FNR == NR {a[$0]++; next}; $2 in a {print $2, $29}' file1 file2 >file3

관련 정보