fasta 형식의 ~25000개 시퀀스가 포함된 텍스트 파일이 있고 각 줄 끝에 >로 시작하는 단어를 추가하고 싶습니다.
답변1
동일한 단어를 일치하는 줄( them 로 시작하는 줄 >
)에 추가해야 하는지 여부를 지정하지 않았으므로 가장 간단한 경우를 가정합니다. 다음은 다음 sed
으로 시작하는 모든 줄 끝에 "PLOP"를 추가합니다 >
.
tmpFile=$(mktemp)
echo -e 'hello world\n>FASTA sequence\nhello again' > "$tmpFile"
echo 'BEFORE :'
cat "$tmpFile"
sed -ri '/^>/ s/^(.*)$/\1 PLOP/' "$tmpFile"
echo 'AFTER :'
cat "$tmpFile"
[ -f "$tmpFile" ] && rm "$tmpFile"
답변2
솔루션앗
awk '{ if ($0 ~ "^>") { $0=$0" added" }} {print $0}' list
또는sed
sed -E "s|^>(.+)$|>\1 added|" list