다른 파일에서 변수 발생 횟수 계산

Question 1

\ts는 실제로 탭 문자이고 동일한 열에 발생하며 A는 AA가 아닌 A에만 일치한다고 가정합니다 . aA, B, C를 포함하는 파일과 b일치 여부를 계산하려는 파일(제공한 두 번째 파일)을 가정 합니다.

먼저, 가능한 일치 항목만 가져오고 b나머지는 모두 무시해야 합니다. 이것은 파일의 일부를 잘라내는 데 b사용할 수 있는 세 번째 열입니다.cut

컷 -f 3b
그런 다음 이를 발생 횟수 및 발생 횟수 목록으로 변환해야 합니다. uniq출력을 정렬하고 이를 계산하는 데 사용할 수 있습니다.cut

정렬|유니클로-c
마지막으로, 당신은 이것을 위해모두in b이지만 의 값만 필요합니다 a. join이를 사용하여 공통 필드(이 경우 첫 번째이자 유일한 필드 a(기본적으로 이 작업을 수행하는 것으로 보임)와 두 번째 파일( 2) b인 두 번째 필드( -2)) 에서 서로 다른 두 파일을 연결할 수 있습니다.

연결-2 2a 결과-b

몇 가지 다른 방법으로 연결할 수 있으며, 한 가지 가능한 방법은 bash프로세스 교체에서 명명된 파이프를 사용하는 것입니다.

join -2 2 a <(cut -f 3 b | sort | uniq -c)

이것은 b를 세 번만 처리하고(다른 열 sort및 제거 uniq) 조인이 입력을 정렬해야 하기 때문에 각 파일을 한 번만 읽을 것이기 때문에 grep 단독보다 적어도 더 나을 것입니다. 물론 이것은 내가 만든 가정에 의존합니다(그리고 정렬도 해야 a하지만 이는 이전의 정렬되지 않은 경우를 <(sort a)대체할 뿐입니다.a

Answer

\ts는 실제로 탭 문자이고 동일한 열에 발생하며 A는 AA가 아닌 A에만 일치한다고 가정합니다 . aA, B, C를 포함하는 파일과 b일치 여부를 계산하려는 파일(제공한 두 번째 파일)을 가정 합니다.

먼저, 가능한 일치 항목만 가져오고 b나머지는 모두 무시해야 합니다. 이것은 파일의 일부를 잘라내는 데 b사용할 수 있는 세 번째 열입니다.cut

컷 -f 3b
그런 다음 이를 발생 횟수 및 발생 횟수 목록으로 변환해야 합니다. uniq출력을 정렬하고 이를 계산하는 데 사용할 수 있습니다.cut

정렬|유니클로-c
마지막으로, 당신은 이것을 위해모두in b이지만 의 값만 필요합니다 a. join이를 사용하여 공통 필드(이 경우 첫 번째이자 유일한 필드 a(기본적으로 이 작업을 수행하는 것으로 보임)와 두 번째 파일( 2) b인 두 번째 필드( -2)) 에서 서로 다른 두 파일을 연결할 수 있습니다.

연결-2 2a 결과-b

몇 가지 다른 방법으로 연결할 수 있으며, 한 가지 가능한 방법은 bash프로세스 교체에서 명명된 파이프를 사용하는 것입니다.

join -2 2 a <(cut -f 3 b | sort | uniq -c)

이것은 b를 세 번만 처리하고(다른 열 sort및 제거 uniq) 조인이 입력을 정렬해야 하기 때문에 각 파일을 한 번만 읽을 것이기 때문에 grep 단독보다 적어도 더 나을 것입니다. 물론 이것은 내가 만든 가정에 의존합니다(그리고 정렬도 해야 a하지만 이는 이전의 정렬되지 않은 경우를 <(sort a)대체할 뿐입니다.a

Question 2

예제 입력에서 탭으로 구분된 레코드의 마지막 필드에 있는 모든 고유 값을 계산하려고 합니다. 이 작업을 수행하는 awk 스니펫은 다음과 같습니다.

awk -F '\t' '
     {++a[$NF]}
     END {for (x in a) {print x "\t" a[x]}}
' File2

Answer

예제 입력에서 탭으로 구분된 레코드의 마지막 필드에 있는 모든 고유 값을 계산하려고 합니다. 이 작업을 수행하는 awk 스니펫은 다음과 같습니다.

awk -F '\t' '
     {++a[$NF]}
     END {for (x in a) {print x "\t" a[x]}}
' File2

Question 3

while 루프를 사용하여 이 작업을 수행할 수 있습니다.

while read arg < FILE1; do echo -n -e "$arg\t"; grep "$arg" FILE2 | wc -l; done

이는 FILE1을 읽고 각 행에 대해 for 루프는 문자열을 $arg 변수에 저장합니다.

그런 다음 $arg를 echo합니다(-n은 끝에 줄 반환(\n)을 삽입하지 않음을 의미하고, -e는 이스케이프 문자를 수행함을 의미합니다).

그런 다음 FILE2에서 발견된 $arg의 발생 횟수를 표시합니다.

Answer

while 루프를 사용하여 이 작업을 수행할 수 있습니다.

while read arg < FILE1; do echo -n -e "$arg\t"; grep "$arg" FILE2 | wc -l; done

이는 FILE1을 읽고 각 행에 대해 for 루프는 문자열을 $arg 변수에 저장합니다.

그런 다음 $arg를 echo합니다(-n은 끝에 줄 반환(\n)을 삽입하지 않음을 의미하고, -e는 이스케이프 문자를 수행함을 의미합니다).

그런 다음 FILE2에서 발견된 $arg의 발생 횟수를 표시합니다.

다른 파일에서 변수 발생 횟수 계산

답변1

답변2

답변3

관련 정보