두 파일에서 ID 열의 일치하는 데이터를 찾고 계산하는 방법은 무엇입니까?

Question 1

awktail, sort및 가 포함된 join솔루션입니다 wc.

join <(awk -F '\t' '{print $125}' file1 | tail -n +2 | sort) <(awk -F '\t' '{print $1}' file2 | tail -n +2 | sort ) | wc -l
3

설명하다.

이 솔루션은 열이 탭으로 구분되어 있다고 가정합니다. awkfile1의 125번째 열과 file2의 첫 번째 열이 수집 됩니다. tail -n +2수집된 결과의 첫 번째 행을 삭제합니다. 체계적인 문서가 필요 sort하므로 필수입니다 . join결과 교차 세트가 wc여기에 공급되고 해당 라인 번호를 반환합니다.

Answer

awktail, sort및 가 포함된 join솔루션입니다 wc.

join <(awk -F '\t' '{print $125}' file1 | tail -n +2 | sort) <(awk -F '\t' '{print $1}' file2 | tail -n +2 | sort ) | wc -l
3

설명하다.

이 솔루션은 열이 탭으로 구분되어 있다고 가정합니다. awkfile1의 125번째 열과 file2의 첫 번째 열이 수집 됩니다. tail -n +2수집된 결과의 첫 번째 행을 삭제합니다. 체계적인 문서가 필요 sort하므로 필수입니다 . join결과 교차 세트가 wc여기에 공급되고 해당 라인 번호를 반환합니다.

Question 2

당신은 가깝습니다. 노력하다

awk 'FNR == 1 {next}; FNR==NR {P[$125]; next} $1 in P {P[$1]++} END {for (p in P) print p, P[p]+0}' file[12]
03:3304593_GA_G_1 1
01:3290834_CT_C_1 0
09:9433933_GA_G_1 1
06:6265733_GA_G_1 1

분명히 file1의 모든 위치를 file2에서 찾을 수 있는 것은 아닙니다.

Answer

당신은 가깝습니다. 노력하다

awk 'FNR == 1 {next}; FNR==NR {P[$125]; next} $1 in P {P[$1]++} END {for (p in P) print p, P[p]+0}' file[12]
03:3304593_GA_G_1 1
01:3290834_CT_C_1 0
09:9433933_GA_G_1 1
06:6265733_GA_G_1 1

분명히 file1의 모든 위치를 file2에서 찾을 수 있는 것은 아닙니다.

두 파일에서 ID 열의 일치하는 데이터를 찾고 계산하는 방법은 무엇입니까?

답변1

답변2

관련 정보