다른 파일의 단어 목록이 포함된 한 파일의 줄을 추출하는 방법은 무엇입니까? [복사]

Question 1

grep -f file1 file2file2모든 패턴을 검색 file1하고 일치하는 라인을 인쇄해야 합니다. (그러나 모든 곳에서 일치하는 경우 첫 번째 열 뒤에 단백질 이름이 나타나면 거짓 긍정이 발생할 수 있습니다.) 고정 문자열을 일치시키려면 -F.

Answer

grep -f file1 file2file2모든 패턴을 검색 file1하고 일치하는 라인을 인쇄해야 합니다. (그러나 모든 곳에서 일치하는 경우 첫 번째 열 뒤에 단백질 이름이 나타나면 거짓 긍정이 발생할 수 있습니다.) 고정 문자열을 일치시키려면 -F.

Question 2

이 문제를 해결하는 한 가지 방법은 file1의 모든 정규식 문자를 이스케이프하고 다음 단계에서 양쪽 끝에서 문자열을 제한하는 것입니다. 단계의 순서가 중요하다는 점에 유의하세요.

hybrid regex이는 일치할 실제 문자열이 모든 정규식 BRE 문자를 이스케이프하여 리터럴 문자열이 되고, 주변에 정규식 문자를 배치하여 일치를 첫 번째 필드로 제한하는 방법 이라고 할 수 있습니다 .

$ < file1 \
    sed -e '
      s:[[\.*^$]:\\&:g
      s/.*/^&[[:blank:]]/
'  | grep -f - file2

*1단계 => BRE 표현식을 사용하여 file1의 문자열을 grep에 해당하는 일반 문자열로 렌더링합니다.

*2단계 => 위 이스케이프 문자열의 왼쪽을 줄의 시작 부분으로 제한하고 오른쪽을 공백 문자로 제한합니다.

Answer

이 문제를 해결하는 한 가지 방법은 file1의 모든 정규식 문자를 이스케이프하고 다음 단계에서 양쪽 끝에서 문자열을 제한하는 것입니다. 단계의 순서가 중요하다는 점에 유의하세요.

hybrid regex이는 일치할 실제 문자열이 모든 정규식 BRE 문자를 이스케이프하여 리터럴 문자열이 되고, 주변에 정규식 문자를 배치하여 일치를 첫 번째 필드로 제한하는 방법 이라고 할 수 있습니다 .

$ < file1 \
    sed -e '
      s:[[\.*^$]:\\&:g
      s/.*/^&[[:blank:]]/
'  | grep -f - file2

*1단계 => BRE 표현식을 사용하여 file1의 문자열을 grep에 해당하는 일반 문자열로 렌더링합니다.

*2단계 => 위 이스케이프 문자열의 왼쪽을 줄의 시작 부분으로 제한하고 오른쪽을 공백 문자로 제한합니다.

Question 3

다음 awk 명령을 사용할 수 있습니다

awk 'NR==FNR{a[$1];next}($1 in a){print $0}' file1 file2

Answer

다음 awk 명령을 사용할 수 있습니다

awk 'NR==FNR{a[$1];next}($1 in a){print $0}' file1 file2

관련 정보