시퀀스에서 문자 발생 횟수를 계산합니다.

시퀀스에서 문자 발생 횟수를 계산합니다.

G시퀀스에서 char 발생 횟수를 계산하려면 unix 스크립트를 작성해야 합니다 ."GTCGTAATGCGGATCGGAATCGA"

나는 출력을 원한다."number of nucleotide G is 8"

답변1

배쉬와 함께

var='GTCGTAATGCGGATCGGAATCGA'
var="${var//[^G]}"
echo "Number of nucleotide G is ${#var}"

답변2

Awk해결책:

awk '{ print "Number of nucleotide G is "gsub("G", "") }' <<<"GTCGTAATGCGGATCGGAATCGA"
Number of nucleotide G is 8

grep+wc해결책:

printf "Number of nucleotide G is %d\n" $(grep -o 'G' <<<"GTCGTAATGCGGATCGGAATCGA" | wc -l)
Number of nucleotide G is 8

답변3

펄 사용:

echo 'GTCGTAATGCGGATCGGAATCGA' | perl -ne 'printf "number of nucleotide G is %d\n", ($_ =~ tr/G/G/)'

tr이는 Perl의 연산자를 사용하여 G를 계산합니다. 대체된 횟수를 반환하며 G를 G로 바꿉니다.

출력은 다음과 같습니다

number of nucleotide G is 8

이것을 다른 염기의 계산에도 일반화하려면 다음을 수행하십시오.아니요게놈 크기의 데이터에 대해 여러 번 실행하지만 다음으로 이동하십시오.생물정보학 StackExchange 사이트그리고 거기서 답을 찾아보세요.

관련 정보