다음과 같은 파일이 있습니다.
VLLKHCGRMRRFLIRNLRSFLSHISLNTLKSQESKV
LLSSQAKMYFSLRENFYLEGGIETTFVPSGEVYSRSFLKGISRI
LNPNALPTSPISENWVMVRPIVAQISLRRMTPSAIGAQTEMA
MKLELLLAFKYLIPKRKRLSSSIVSAFSMGIVALVVWLSVVFMSVIHGLQQRWVGDLASLHSSIRIEPSDKYYESYYYQIDSHAEASQYIYKTIGEKLLCEQTDPYDPDVDFLLPEAFPDPEFSDNGEMIDPVRTANERMLSLFSSRKGSFVEFEEGMGHVHMDRAFRGHKGEPRALSQYIAYSSDILYQQRMLPFEETDYSTEVLNRFNASSEGWLADFLVLQEKFRGMSVILPVVYRDQGYRVGDTASLSVFSVKKEGEVRFPLRVIGFYNPGVSPFGGKTIFIDKELAASIRSESEGLGMHNGWQVFLPSVQDIPVMKQSIQKIFKESEVSSYWEISSLYDYEFFKPILDQLQSDQVLFSIVSFIVLIVACSNIVTMSILLVNNKKKEIGILKAMGVSSSRLQLVFGLCGACSGLVGALLGSILAALTLKNLGILTHWLSKLQGREAFNPSFFGEQLPQDFHLPTVICLSLGALVLAAISGAIPAQHVARMQVSDILKSE
MVILVEAKHISKVIQQQDVCIPILKDVSFQLHAGEVVAITGASGSGKSSLLHLLGTLDQPSSGQILFFGKQVRREELPIFRNCRIGFIFQNFYLLEDDSVINNVLMPAQIARKDTGQKSKARERALALLESVGLVDRRDEKGSLLSGGEKQRVAIARALMNDPEIVLADEPSGNLDHRTADTIHELLLALAEKHRGVLIVTHDRELAEKCHREEILRDGTLMQRQ
LKDTVTPNYHPGMIRRFRPLTQTSTRSGYHKSE
LHVSCLEWLSMITFTRTPLRIAWARAKKNSGLKKIYIKTKILSVAWLIAFKIIFDAALGIKRWIGM
LADPVTTVWKSANIVFLCWRVLPLVRRKTTLEF
LARRRSGSFRGGRRSVFGSLVFSLGSGEHLLGDGY
VGARVRIDANRLSIPSMIVFIANNRRGLWVTIPF
VEEVGSGGLKRSLYFKEEEPCTLITLRSWLEKKET
파일의 각 줄을 원본 파일의 줄 번호( , 1
등 )로 이름을 지정하여 자체 파일에 저장하고 싶습니다. 또한 각 시퀀스 앞에 a로 시작하여 줄 번호를 추가하는 줄을 추가해야 합니다 .2
3
>
따라서 1.txt
다음과 같습니다.
>1
VLLKHCGRMRRFLIRNLRSFLSHISLNTLKSQESKV
및 2.txt:
>2
LLSSQAKMYFSLRENFYLEGGIETTFVPSGEVYSRSFLKGISRI
등. 어떻게 해야 하나요?
답변1
당신이 사용할 수있는 awk
:
awk '{print > NR".txt"}' file
NR
는 의 현재 줄 번호 awk
이므로 위 명령은 각 줄을 현재 줄 번호에 를 더한 파일로 인쇄합니다 .txt
.
시퀀스에 접두사를 추가하려면 >
다음을 사용하십시오.
awk '{print ">"$0 > NR".txt"}' file
>
올바른 FASTA 형식을 원하는 경우(각 시퀀스 앞에는 시퀀스 이름으로 시작하는 줄이 옵니다) 다음 명령을 사용하세요.
awk '{printf ">%s\n%s\n",NR,$0 > NR".txt"}' file
그러면 다음과 같은 파일이 생성됩니다.
$ cat 3.txt
>3
LNPNALPTSPISENWVMVRPIVAQISLRRMTPSAIGAQTEMA