명령줄 도구를 통해 두 DNA 서열 간의 차이점을 표시하는 방법

Question 1

이것이 당신이 쫓는 것인가요?

awk '{$3=$1;sub($2,"",$3)}1' file

$3=$1첫 번째 필드를 세 번째 필드에 복사하고
sub($2,"",$3)세 번째 필드 내에서 두 번째 필드를 찾습니다. 일치하는 항목이 있으면 sub일치하는 문자열을 세 번째 필드의 빈 문자열로 바꿉니다.
마지막으로 1결과를 인쇄합니다. 이는 {print}명령문과 동일하므로 로 다시 작성할 수 있습니다 {$3=$1;sub($2,"",$3);print}.

결과:

AAAGGGTTT AAAGGG TTT
AAAGGGCCC GGGCCC AAA

Answer

이것이 당신이 쫓는 것인가요?

awk '{$3=$1;sub($2,"",$3)}1' file

$3=$1첫 번째 필드를 세 번째 필드에 복사하고
sub($2,"",$3)세 번째 필드 내에서 두 번째 필드를 찾습니다. 일치하는 항목이 있으면 sub일치하는 문자열을 세 번째 필드의 빈 문자열로 바꿉니다.
마지막으로 1결과를 인쇄합니다. 이는 {print}명령문과 동일하므로 로 다시 작성할 수 있습니다 {$3=$1;sub($2,"",$3);print}.

결과:

AAAGGGTTT AAAGGG TTT
AAAGGGCCC GGGCCC AAA

Question 2

시퀀스의 쌍별 정렬을 표시해야 하는 경우 적절한 생물정보학 도구를 사용하십시오. 서열 정렬은 일반 사용자가 기대하는 형식의 차이를 보여줍니다. 여기에서 뉴클레오티드 서열의 쌍별 정렬을 위해 blastnBLAST 도구(예: 와 함께 설치 가능 )를 사용할 수 있습니다. conda스레드에서 다음 명령을 참조하십시오.https://www.biostars.org/p/18087/#18095:

blastn -query querySeqSet.fasta -subject targetSeqSet.fasta

Answer

시퀀스의 쌍별 정렬을 표시해야 하는 경우 적절한 생물정보학 도구를 사용하십시오. 서열 정렬은 일반 사용자가 기대하는 형식의 차이를 보여줍니다. 여기에서 뉴클레오티드 서열의 쌍별 정렬을 위해 blastnBLAST 도구(예: 와 함께 설치 가능 )를 사용할 수 있습니다. conda스레드에서 다음 명령을 참조하십시오.https://www.biostars.org/p/18087/#18095:

blastn -query querySeqSet.fasta -subject targetSeqSet.fasta

명령줄 도구를 통해 두 DNA 서열 간의 차이점을 표시하는 방법

답변1

답변2

관련 정보