Unix 명령을 사용하여 파일에서 >로 시작하는 각 줄 끝에 단어를 추가합니다.

Unix 명령을 사용하여 파일에서 >로 시작하는 각 줄 끝에 단어를 추가합니다.

fasta 형식의 ~25000개 시퀀스가 ​​포함된 텍스트 파일이 있고 각 줄 끝에 >로 시작하는 단어를 추가하고 싶습니다.

답변1

동일한 단어를 일치하는 줄( them 로 시작하는 줄 >)에 추가해야 하는지 여부를 지정하지 않았으므로 가장 간단한 경우를 가정합니다. 다음은 다음 sed으로 시작하는 모든 줄 끝에 "PLOP"를 추가합니다 >.

tmpFile=$(mktemp)
echo -e 'hello world\n>FASTA sequence\nhello again' > "$tmpFile"
echo 'BEFORE :'
cat "$tmpFile"
sed -ri '/^>/ s/^(.*)$/\1 PLOP/' "$tmpFile"
echo 'AFTER :'
cat "$tmpFile"
[ -f "$tmpFile" ] && rm "$tmpFile"

답변2

솔루션

awk '{ if ($0 ~ "^>") { $0=$0" added" }} {print $0}' list

또는sed

sed -E "s|^>(.+)$|>\1 added|" list

관련 정보