Linux의 Fasta 파일에서 열 추출

Question 1

사용 awk:

awk -F ':' '/^>/ { sub(" .*",    "", $10)
                   sub(" \\[.*", "", $11)
                   print $10, $11 }' file.fa

추출하려는 데이터는 [각 헤더 행의 10번째 필드에 있는 첫 번째 단어와 11번째 필드까지의 모든 것입니다(필드가 :구분된 경우).

이 코드는 10번째 필드의 첫 번째 공백과 [11번째 필드 이후의 모든 내용( [이전 공백 포함)을 제거합니다.

그런 다음 수정된 필드 10과 11을 인쇄합니다.

질문의 데이터 출력을 제공합니다.

TRBD1 T cell receptor beta diversity 1
TRDD2 T cell receptor delta diversity 2

Answer

사용 awk:

awk -F ':' '/^>/ { sub(" .*",    "", $10)
                   sub(" \\[.*", "", $11)
                   print $10, $11 }' file.fa

추출하려는 데이터는 [각 헤더 행의 10번째 필드에 있는 첫 번째 단어와 11번째 필드까지의 모든 것입니다(필드가 :구분된 경우).

이 코드는 10번째 필드의 첫 번째 공백과 [11번째 필드 이후의 모든 내용( [이전 공백 포함)을 제거합니다.

그런 다음 수정된 필드 10과 11을 인쇄합니다.

질문의 데이터 출력을 제공합니다.

TRBD1 T cell receptor beta diversity 1
TRDD2 T cell receptor delta diversity 2

Question 2

다음과 같이 시도해 보세요.

cat ... | sed -n '/^>/ { s/.*description: *//; s/\[.*//; p; }'

(모바일기기라 테스트는 안해봤습니다.)

더 우아한 방법이 있습니다. 예를 들어 Awk 루프가 가장 유연합니다.

Answer

다음과 같이 시도해 보세요.

cat ... | sed -n '/^>/ { s/.*description: *//; s/\[.*//; p; }'

(모바일기기라 테스트는 안해봤습니다.)

더 우아한 방법이 있습니다. 예를 들어 Awk 루프가 가장 유연합니다.

관련 정보