Wget은 github tar.gz 파일을 HTML 문서, UTF-8 유니코드 텍스트로 다운로드합니까?

Wget은 github tar.gz 파일을 HTML 문서, UTF-8 유니코드 텍스트로 다운로드합니까?

이 파일을 다운로드해야 합니다. https://github.com/cbherer/Bherer_etal_SexualDimorphismRecombination/blob/master/Refined_genic_map_b37.tar.gz

이것은 내 명령입니다:

wget https://github.com/cbherer/Bherer_etal_SexualDimorphismRecombination/blob/master/Refined_genetic_map_b37.tar.gz

파일이 다운로드되었지만 그 안에 있는 텍스트 파일에 액세스하고 싶습니다. 나는 시도했다:

tar -zxvf Refined_genetic_map_b37.tar.gz
gzip: stdin: not in gzip format
tar: Child returned status 1
tar: Error is not recoverable: exiting now

파일을 확인했습니다.

file Refined_genetic_map_b37.tar.gz
Refined_genetic_map_b37.tar.gz: HTML document, UTF-8 Unicode text, with very long lines

그렇다면 텍스트 파일을 어떻게 추출해야 합니까?

답변1

파일에 액세스하는 데 잘못된 URL을 사용했습니다. 당신이 얻는 것은 웹 페이지입니다. 올바른 URL은 다음과 같습니다.

https://github.com/cbherer/Bherer_etal_SexualDimorphismRecombination/raw/master/Refined_EUR_genetic_map_b37.tar.gz

raw대신 주의를 기울이십시오 blob.

원본 URL로 이동하여 페이지의 "다운로드" 버튼 링크를 확인하면 이 URL이 표시됩니다.

답변2

지적한대로@쿠살라난다, 다운로드해야 합니다 raw. 여기에 또 다른 링크가 있습니다(브라우저를 통해서도 다운로드할 수 있음).

wget https://raw.githubusercontent.com/cbherer/Bherer_etal_SexualDimorphismRecombination/master/Refined_genetic_map_b37.tar.gz

관련 정보