제목 아래 시퀀스 연결

제목 아래 시퀀스 연결

File1과 같은 파일이 있습니다. 예를 들어 제목이 "Contig1"이고 해당 제목 아래의 모든 시퀀스를 연결하고 싶습니다.

파일 1:

>Contig1
ACCCCATACATCCAAA
NNNNNNNNNNCATACA
AAAAAAAACTANNNNN
ACATACAAAAA
>Contig12
CCCCACAATTTTTAAA
GGGGGNNNNNCATACA
AGGAATTAACTANNAC
GGATATA

예상 출력:

>Contig1
ACCCCATACATCCAAANNNNNNNNNNCATACAAAAAAAAACTANNNNNACATACAAAAA
>Contig12
CCCCACAATTTTTAAAGGGGGNNNNNCATACAAGGAATTAACTANNACGGATATA

도와주세요? 건배!

답변1

또 다른 이상한:

awk '{$1=RS $1 ORS}NR>1' FS='\n' RS=\> OFS= file

답변2

 perl -pe 'chomp unless /^>/; print "\n" if /^>/ and $. > 1' < File1

마지막 줄 바꿈을 추가해야 할 수도 있습니다.

답변3

해결책 awk:

awk '/^>/{if(FNR>1)printf "\n";print;next};{printf "%s", $0}' file

perl다음과 같은 솔루션@choroba의 답변, 그러나 최종 개행 문자를 처리합니다.

perl -pe 'chomp unless /^>/ or eof;print "\n" if /^>/ and $. > 1' file

관련 정보