목록의 새 ID에 따라 fasta 파일의 seq ID를 바꿉니다.

Question 1

사용 awk:

awk -F'\t' '
  NR==FNR{ a[$1]=$2; next }
  /^>/{ 
    id=a[substr($0, 2)]
    if (id!=""){ print ">" id; next }
  }
  1
' textfile file.fasta

먼저 매핑이 포함된 텍스트 파일을 읽고 a첫 번째 필드를 인덱스로 사용하여 두 번째 필드를 배열에 저장합니다. 녹음 으로 건너뛰세요 next.

그런 다음 fasta 파일을 읽으십시오. 레코드가 로 시작하는 경우 현재 레코드( )에서 첫 번째 문자를 제거하고 해당 값을 배열 인덱스로 사용하여 >배열에서 새 ID를 찾습니다 . id가 비어 있지 않으면 id를 인쇄하고 레코드로 이동합니다.substr($0, 2)
>next

1현재 레코드(시퀀스 또는 일치하지 않는 ID)를 인쇄합니다 .

Answer

사용 awk:

awk -F'\t' '
  NR==FNR{ a[$1]=$2; next }
  /^>/{ 
    id=a[substr($0, 2)]
    if (id!=""){ print ">" id; next }
  }
  1
' textfile file.fasta

먼저 매핑이 포함된 텍스트 파일을 읽고 a첫 번째 필드를 인덱스로 사용하여 두 번째 필드를 배열에 저장합니다. 녹음 으로 건너뛰세요 next.

그런 다음 fasta 파일을 읽으십시오. 레코드가 로 시작하는 경우 현재 레코드( )에서 첫 번째 문자를 제거하고 해당 값을 배열 인덱스로 사용하여 >배열에서 새 ID를 찾습니다 . id가 비어 있지 않으면 id를 인쇄하고 레코드로 이동합니다.substr($0, 2)
>next

1현재 레코드(시퀀스 또는 일치하지 않는 ID)를 인쇄합니다 .

Question 2

awk -F'\t' '
    NR==FNR { map[">"$1] = ">"$2; next }
    $0 in map { $0 = map[$0] }
    { print }
' mapfile fastafile

Answer

awk -F'\t' '
    NR==FNR { map[">"$1] = ">"$2; next }
    $0 in map { $0 = map[$0] }
    { print }
' mapfile fastafile

목록의 새 ID에 따라 fasta 파일의 seq ID를 바꿉니다.

답변1

답변2

관련 정보