폴더의 모든 파일을 찾아 바꾸는 특수 패턴

Question

실제 파일 이름을 보여주면 이를 조정할 수 있지만, 예제 이름이 항상 _파일 이름의 첫 번째 문자열 이전에 가장 긴 문자열이라고 가정하면 다음을 수행할 수 있습니다.

for file in *_R2.fastq.gz.fa; do
   sed -i '.bak' "s/\(>${file%%_*}\).*/\1/" "$file"
done

${file%%_*}보다 일반적으로 or 구문은 ${var%%pattern}"문자열 끝에서 가장 긴 패턴 발생을 제거"하는 데 사용되는 bash 문자열 작업입니다. 여기서 패턴은 _*첫 번째 _부터 문자열 끝까지 모든 것을 제거하고 샘플 이름은 남깁니다. 이렇게 -i '.bak'하면 sed수정된 모든 파일의 백업 복사본이 생성됩니다. 원하지 않으면 사용할 수 있지만 BSD (macOS에 있는 기능) 에서는 단독으로 사용할 -i ''수 없습니다 . 마지막으로 표현식은 유지하려는 부분을 캡처하여 유지하고 나머지는 제거합니다.-isedsed\1

증가하는 숫자(그 모양)만 제거하려는 경우 1첫 번째 Sequence ID 행, 2두 번째 Sequence ID 행 등에서 제거하려는 경우 다음과 같이 더 직접적으로 수행할 수 있습니다.

perl -i '.bak' -pe '$k++ if />/; s/(>.+?)$k.*/$1/' *_R2.fastq.gz.fa

비결은 a를 볼 때 $k마다 하나를 추가한 다음 a 값 이전의 값을 유지하고 나머지는 삭제한다는 것입니다.>$k

Answer 1

실제 파일 이름을 보여주면 이를 조정할 수 있지만, 예제 이름이 항상 _파일 이름의 첫 번째 문자열 이전에 가장 긴 문자열이라고 가정하면 다음을 수행할 수 있습니다.

for file in *_R2.fastq.gz.fa; do
   sed -i '.bak' "s/\(>${file%%_*}\).*/\1/" "$file"
done

${file%%_*}보다 일반적으로 or 구문은 ${var%%pattern}"문자열 끝에서 가장 긴 패턴 발생을 제거"하는 데 사용되는 bash 문자열 작업입니다. 여기서 패턴은 _*첫 번째 _부터 문자열 끝까지 모든 것을 제거하고 샘플 이름은 남깁니다. 이렇게 -i '.bak'하면 sed수정된 모든 파일의 백업 복사본이 생성됩니다. 원하지 않으면 사용할 수 있지만 BSD (macOS에 있는 기능) 에서는 단독으로 사용할 -i ''수 없습니다 . 마지막으로 표현식은 유지하려는 부분을 캡처하여 유지하고 나머지는 제거합니다.-isedsed\1

증가하는 숫자(그 모양)만 제거하려는 경우 1첫 번째 Sequence ID 행, 2두 번째 Sequence ID 행 등에서 제거하려는 경우 다음과 같이 더 직접적으로 수행할 수 있습니다.

perl -i '.bak' -pe '$k++ if />/; s/(>.+?)$k.*/$1/' *_R2.fastq.gz.fa

비결은 a를 볼 때 $k마다 하나를 추가한 다음 a 값 이전의 값을 유지하고 나머지는 삭제한다는 것입니다.>$k

폴더의 모든 파일을 찾아 바꾸는 특수 패턴

답변1

관련 정보