동적 다운로드 링크가 제공된 cURL을 사용하여 기사 다운로드

동적 다운로드 링크가 제공된 cURL을 사용하여 기사 다운로드

다운로드하려고 해요이것출판된 저널 기사를 사용하십시오 cURL. 오픈 액세스 홈페이지이므로 누구나 기사를 보거나 다운로드하는 데 문제가 없습니다. 그런 다음 추출하면 pdfurl계속 변경됩니다.

그런 다음 PDF를 다운로드하려고 합니다.

curl -L -o test.pdf "http://www.sciencedirect.com/science/article/pii/S0378426612000817/pdfft?md5=6a85f34def09dd5cfb1d1b8feded0d51&pid=1-s2.0-S0378426612000817-main.pdf"

하지만 항상 홈페이지로 리디렉션한 다음 "test.pdf"라는 HTML 페이지로 다운로드합니다.

답변1

curlwget리디렉션이 기본과 다르게 처리되는 것 같습니다 . URL을 직접 다운로드하려면 일부 리디렉션이 필요하며 첫 번째 리디렉션 후 HTTP Referer 헤더가 올바르게 설정되어야 합니다(그렇지 않으면 HTML 페이지가 표시됩니다).

먼저 curlwith 에서 위치 리디렉션을 활성화한 -L다음 curlwith 에서 리퍼러 헤더의 자동 처리를 활성화 해야 합니다 --referer ";auto". 즉,

curl -L --referer ";auto" -o test.pdf URL-for-direct-download

답변2

관련 정보