File1과 같은 파일이 있습니다. 예를 들어 제목이 "Contig1"이고 해당 제목 아래의 모든 시퀀스를 연결하고 싶습니다.
파일 1:
>Contig1
ACCCCATACATCCAAA
NNNNNNNNNNCATACA
AAAAAAAACTANNNNN
ACATACAAAAA
>Contig12
CCCCACAATTTTTAAA
GGGGGNNNNNCATACA
AGGAATTAACTANNAC
GGATATA
예상 출력:
>Contig1
ACCCCATACATCCAAANNNNNNNNNNCATACAAAAAAAAACTANNNNNACATACAAAAA
>Contig12
CCCCACAATTTTTAAAGGGGGNNNNNCATACAAGGAATTAACTANNACGGATATA
도와주세요? 건배!
답변1
또 다른 이상한:
awk '{$1=RS $1 ORS}NR>1' FS='\n' RS=\> OFS= file
답변2
perl -pe 'chomp unless /^>/; print "\n" if /^>/ and $. > 1' < File1
마지막 줄 바꿈을 추가해야 할 수도 있습니다.
답변3
해결책 awk
:
awk '/^>/{if(FNR>1)printf "\n";print;next};{printf "%s", $0}' file
perl
다음과 같은 솔루션@choroba의 답변, 그러나 최종 개행 문자를 처리합니다.
perl -pe 'chomp unless /^>/ or eof;print "\n" if /^>/ and $. > 1' file