검색 패턴 파일을 사용하여 CSV의 마지막 열에서 정확한 단어를 검색하려면 어떻게 해야 합니까?

Question 1

awk 'NR==FNR{a[$1];next}{n=split($NF,b,";");for(i=1;i<=n;i++){if(b[i] in a){print;break}}}' file2 file1

풀린 버전:

awk '
  NR==FNR{a[$1];next}
  {
    n=split($NF,b,";")
    for(i=1;i<=n;i++){
      if(b[i] in a){print;break}
    }
  }   
' file2 file1

split($NF,b,";")마지막 필드를 세미콜론으로 분할하고 결과를 b배열에 넣습니다. b할당된 요소의 수를 반환합니다 n. 귀하의 예제 라인 에서 n=2및 .b[1]=166486b[2]=1897048

if(b[i] in a){print;break}정확히 일치하는 항목이 있으면 해당 줄을 인쇄하고 루프를 중단하여 동일한 줄이 두 번 인쇄되지 않도록 하세요.

Answer

awk 'NR==FNR{a[$1];next}{n=split($NF,b,";");for(i=1;i<=n;i++){if(b[i] in a){print;break}}}' file2 file1

풀린 버전:

awk '
  NR==FNR{a[$1];next}
  {
    n=split($NF,b,";")
    for(i=1;i<=n;i++){
      if(b[i] in a){print;break}
    }
  }   
' file2 file1

split($NF,b,";")마지막 필드를 세미콜론으로 분할하고 결과를 b배열에 넣습니다. b할당된 요소의 수를 반환합니다 n. 귀하의 예제 라인 에서 n=2및 .b[1]=166486b[2]=1897048

if(b[i] in a){print;break}정확히 일치하는 항목이 있으면 해당 줄을 인쇄하고 루프를 중단하여 동일한 줄이 두 번 인쇄되지 않도록 하세요.

Question 2

Python 데이터 구조는 set세미콜론으로 구분된 숫자 중 하나가 file2 숫자로 구성된 다른 세트에서 발견되는지 비교하고 찾는 방법을 제공합니다. Yield가 비어 있지 않고 교차점이 설정되면 현재 행을 계속 인쇄합니다.

python3 - file1 file2 <<\eof
import sys

data, pat = sys.argv[1:]
rs, fs = '\n', '\t'

with open(pat) as fp, open(data) as fd:
  pats = set(fp.read().splitlines())
  for l in fd:
    s = l.rstrip(rs).split(fs)[-1].split(';')
    if set(s) & pats: print(l, end='')
eof

Answer

Python 데이터 구조는 set세미콜론으로 구분된 숫자 중 하나가 file2 숫자로 구성된 다른 세트에서 발견되는지 비교하고 찾는 방법을 제공합니다. Yield가 비어 있지 않고 교차점이 설정되면 현재 행을 계속 인쇄합니다.

python3 - file1 file2 <<\eof
import sys

data, pat = sys.argv[1:]
rs, fs = '\n', '\t'

with open(pat) as fp, open(data) as fd:
  pats = set(fp.read().splitlines())
  for l in fd:
    s = l.rstrip(rs).split(fs)[-1].split(';')
    if set(s) & pats: print(l, end='')
eof

Question 3

주문하다

 awk 'NR == FNR {a[$1];next}FS=";"($NF in  a){print $0}' f2 f1

산출

NODE_1_length_45927_cov_22.029055_g0_i0 WP_055195622.1  93.1    729     50      0       291     2477    1       729     0.0e+00 1275.4  166486;1897048

Answer

주문하다

 awk 'NR == FNR {a[$1];next}FS=";"($NF in  a){print $0}' f2 f1

산출

NODE_1_length_45927_cov_22.029055_g0_i0 WP_055195622.1  93.1    729     50      0       291     2477    1       729     0.0e+00 1275.4  166486;1897048

검색 패턴 파일을 사용하여 CSV의 마지막 열에서 정확한 단어를 검색하려면 어떻게 해야 합니까?

답변1

답변2

답변3

관련 정보