나는 여기에 대한 답변을 따르고 있습니다.https://webapps.stackexchange.com/questions/12311/how-to-download-all-english-books-from-gutenberg어느 것이 사용 중인지wget
wget
특정 시작 오프셋에서 다운로드하고 싶습니다 http://www.gutenberg.org/robot/harvest?offset=100000filetypes[]=txt
. 이전 파일을 다운로드했는데 첫 페이지부터 시작되기 때문이죠.
이것을 어떻게 피할 수 있습니까?
답변1
귀하의 문제는 URL의 다음 부분에 있는 것 같습니다.
?offset=100000filetypes[]=txt
offset
이는 두 개의 필드( 및 ) 를 포함하는 쿼리 문자열입니다 filetypes[]
.
쿼리 문자열의 이름-값 필드 대응은 앰퍼샌드로 구분됩니다. 이 시도:
?offset=100000&filetypes[]=txt
필드를 구분 하지 않으면 &
서버에 "100000filetypes[]=txt" 오프셋을 원한다고 알리는 것입니다. 그러면 서버는 이를 잘못된 매개변수로 간주하여 거부하고 기본값 0을 제공합니다.