wget은 전체 파일을 다운로드하지 않고 즉시 파일에서 특정 정보를 추출합니다.

wget은 전체 파일을 다운로드하지 않고 즉시 파일에서 특정 정보를 추출합니다.

특정 위치에서 다운로드하려는 일부 파일(.bam 형식(바이너리))이 있습니다. wget을 사용하여 다운로드할 수 있으며 그로부터 특정 정보를 추출하고 싶습니다. 이를 위해 나는 samtools를 사용합니다. 제가 알고 싶은 것은 bam 파일 전체를 다운로드할 필요 없이 bam 파일에서 원하는 것을 즉시 추출한 다음 필요한 것을 추출한 다음 해당 내용을 삭제할 수 있는 방법이 있습니까? 원본 bam 파일.

사용된 명령은

wget link.bam

samtools view -h chr1 link.bam | samtools view -bS > condensed.bam

전체 원본 bam 파일을 내 하드 드라이브에 다운로드하지 않고도 이 작업을 수행할 수 있습니까? 공간이 부족하고 파일이 크기 때문에 이렇게 하고 싶습니다.

너에게 듣기를 바래.

감사해요

답변1

표준 접근 방식은 입니다 wget -O- _url_ | samtools view -h chr1 - | samtools view -bS >condensed.bam. 확실하지 않은 경우 출력은 0이 아니라 O입니다.

다음 파이프라인과 관련된 바이트 수를 알고 있으면 다른 최적화 단계를 얻을 수 있습니다. samtools처음 1352바이트만 필요하다고 가정합니다 . 당신은 사용할 수 있습니다 curl(기준으로이 질문/답변, wget오류가 있습니다. )

curl -r 0-1352 | ...

관련 정보