빅데이터 분석을 위해 수천 개의 파일을 반복하고 계시나요?

Question

codem1프로세스의 출력 (그게 무엇이든)을 보면 파일을 찾을 수 없다는 내용이 표시됩니다 OG0018055. 이는 파일이 실제로 호출되므로 논리적일 뿐입니다.OG0018055.fa

스크립트에서 .fa파일 이름 줄의 확장자를 제거 할 수 있습니다.

gene_name="${filename%%.*}"

유전자 이름을 알아보세요. 그런 다음 sed파일 템플릿의 모든 패턴 발생을 해당 유전자 이름으로 바꿀 수 있습니다 . GENE그러나 이는 업데이트된 codeml_0.ctl파일에서 해당 seqfile행이 다음과 같다는 것을 의미합니다.

seqfile = ../pamlfiles/OG0018055

따라서 .fa여기에는 확장이 없습니다.

따라서 템플릿 파일을 수정하여 읽으십시오.

seqfile = ../pamlfiles/GENE.fa

이렇게 하면 .fa파일 확장자가 손실되지 않습니다.

Answer 1