G
시퀀스에서 char 발생 횟수를 계산하려면 unix 스크립트를 작성해야 합니다 ."GTCGTAATGCGGATCGGAATCGA"
나는 출력을 원한다."number of nucleotide G is 8"
답변1
배쉬와 함께
var='GTCGTAATGCGGATCGGAATCGA'
var="${var//[^G]}"
echo "Number of nucleotide G is ${#var}"
답변2
Awk
해결책:
awk '{ print "Number of nucleotide G is "gsub("G", "") }' <<<"GTCGTAATGCGGATCGGAATCGA"
Number of nucleotide G is 8
grep
+wc
해결책:
printf "Number of nucleotide G is %d\n" $(grep -o 'G' <<<"GTCGTAATGCGGATCGGAATCGA" | wc -l)
Number of nucleotide G is 8
답변3
펄 사용:
echo 'GTCGTAATGCGGATCGGAATCGA' | perl -ne 'printf "number of nucleotide G is %d\n", ($_ =~ tr/G/G/)'
tr
이는 Perl의 연산자를 사용하여 G를 계산합니다. 대체된 횟수를 반환하며 G를 G로 바꿉니다.
출력은 다음과 같습니다
number of nucleotide G is 8
이것을 다른 염기의 계산에도 일반화하려면 다음을 수행하십시오.아니요게놈 크기의 데이터에 대해 여러 번 실행하지만 다음으로 이동하십시오.생물정보학 StackExchange 사이트그리고 거기서 답을 찾아보세요.