
나는 다음 줄을 포함하는 fasta 파일을 작업 중입니다.
\>97977-100;sample=Samp1
TAATGATGATTTGT
\>97978-60;sample=Samp2
AACATTCAACGCGGTCGGTGAGTA
\>97979-30;sample=Samp3
AACCGTAGGAGTTGATGTGCGGT
\>97980-20;sample=Samp4
ACTGTCTGTATGTGGTG
-
와 사이의 모든 문자를 찾아서 ;
text 와 함께 줄 끝에 추가하고 싶습니다 ;size="(value)";
. 그러면 다음과 같은 결과를 얻을 수 있습니다.
\>97977-100;sample=Samp1;size=100;
TAATGATGATTTGT
\>97978-60;sample=Samp2;size=60;
AACATTCAACGCGGTCGGTGAGTA
\>97979-30;sample=Samp3;size=30;
AACCGTAGGAGTTGATGTGCGGT
\>97980-20;sample=Samp4;size=20;
ACTGTCTGTATGTGGTG
나는 보았다이 문제두 문자열 사이의 문자를 찾는 방법에 대한 도움말은 다음을 통해 얻을 수 있습니다.
sed -n 1~2p $file | sed -e 's/.*-\(.*\);.*/\1/'
줄 끝에 추가하는 방법을 알고 있습니다.
sed "1~2s/$/;size=(I want this to be the output of the command above);/" $file
그러나 나는 그 둘을 합치지 않을 것이다. sed
너무 큰 인수 오류가 발생하므로 두 명령 모두 사용할 수 없습니다 .
답변1
sed
해결책:
sed -E 's/(.*-)([0-9]+)(;.*)/\1\2\3;size=\2;/' file
산출:
>97977-100;sample=Samp1;size=100;
TAATGATGATTTGT
>97978-60;sample=Samp2;size=60;
AACATTCAACGCGGTCGGTGAGTA
>97979-30;sample=Samp3;size=30;
AACCGTAGGAGTTGATGTGCGGT
>97980-20;sample=Samp4;size=20;
또는awk
:
awk -F'-' '/^>/{ $0=$0";size=" int($2) ";" }1' file