다운로드하려고 해요이것출판된 저널 기사를 사용하십시오 cURL
. 오픈 액세스 홈페이지이므로 누구나 기사를 보거나 다운로드하는 데 문제가 없습니다. 그런 다음 추출하면 pdfurl
계속 변경됩니다.
그런 다음 PDF를 다운로드하려고 합니다.
curl -L -o test.pdf "http://www.sciencedirect.com/science/article/pii/S0378426612000817/pdfft?md5=6a85f34def09dd5cfb1d1b8feded0d51&pid=1-s2.0-S0378426612000817-main.pdf"
하지만 항상 홈페이지로 리디렉션한 다음 "test.pdf"라는 HTML 페이지로 다운로드합니다.
답변1
curl
wget
리디렉션이 기본과 다르게 처리되는 것 같습니다 . URL을 직접 다운로드하려면 일부 리디렉션이 필요하며 첫 번째 리디렉션 후 HTTP Referer 헤더가 올바르게 설정되어야 합니다(그렇지 않으면 HTML 페이지가 표시됩니다).
먼저 curl
with 에서 위치 리디렉션을 활성화한 -L
다음 curl
with 에서 리퍼러 헤더의 자동 처리를 활성화 해야 합니다 --referer ";auto"
. 즉,
curl -L --referer ";auto" -o test.pdf URL-for-direct-download