데이터에 대한 여러 프로필 만들기

데이터에 대한 여러 프로필 만들기

pair.eg Sample_27931_RNAX_ 형식의 데이터 파일이 있습니다.R1.fastq.gz 및 FASTQ/Sample_27931_RN​​AX_R2.fastq.gz는 샘플에 속합니다. 아래에는 각각 R1 및 R2 쌍이 있는 3개 샘플에 대한 데이터가 나와 있습니다.

분석을 실행하기 위해 개별적으로 경로 목록을 만들었습니다. 따라서 list1에는 모든 R1이 포함되고 list2에는 모든 R2가 포함됩니다.

다음은 3개의 샘플 목록입니다. 1

$TMPDIR/FASTQ/Sample_27931_RNAX_R1.fastq.gz 
$TMPDIR/FASTQ/Sample_28891_RNAX_R1.fastq.gz 
$TMPDIR/FASTQ/Sample_28897_RNAX_R1.fastq.gz

다음은 3개의 샘플 목록입니다. 2

$TMPDIR/FASTQ/Sample_27931_RNAX_R2.fastq.gz
$TMPDIR/FASTQ/Sample_28891_RNAX_R2.fastq.gz
$TMPDIR/FASTQ/Sample_28897_RNAX_R2.fastq.gz

각 예제(총 3개)에 대한 구성 파일을 생성하고 싶습니다. 각 예마다 별도의 구성 파일을 생성해야 합니다.

예를 들어 샘플 구성 파일은 다음과 같습니다.

**fastq1        = $TMPDIR/FASTQ/Sample_27931_RNAX_R1.fastq.gz**
**fastq2        = $TMPDIR/FASTQ/Sample_27931_RNAX_R2.fastq.gz**

mailto         = [email protected]
thread_no      = 8

detect_integration = yes   # if no is provided, VirusFinder will not detect virus integrations
detect_mutation    = no   # if no is provided, VirusFinder will not detect viral mutations

fastq1 및 fastq2 매개변수는 list1 및 list2의 경로로 변경되어야 하지만 나머지는 동일하게 유지됩니다. list1 및 list2를 사용하여 여러 구성 파일을 만드는 방법은 무엇입니까? 구성 파일의 이름은 샘플 이름에서 자동으로 가져와야 합니다. 예를 들어 Sample_27931_RN​​AX의 경우 Sample_27931_RN​​AX.config.txt입니다. 유사한 게시물에 대한 제안이나 링크가 있으면 좋습니다. 비슷한 게시물을 찾을 수 없습니다.

감사해요,

답변1

#!/bin/bash
while IFS= read -r samp1; do

b=${samp1%_R1.fastq.gz} samp2=${b}_R2.fastq.gz

cat - <<eof > "${b##*/}.cfg"
**fastq1        = $samp1**
**fastq2        = $samp2**

mailto         = [email protected]
thread_no      = 8

detect_integration = yes  # if no is provided, VirusFinder will not detect virus integrations
detect_mutation    = no   # if no is provided, VirusFinder will not detect viral
eof
done < LIST1

첫 번째 샘플 자체에서 두 번째 샘플 fastq의 이름을 접목할 수 있으므로 List2는 실제로 필요하지 않습니다.

관련 정보