CIA 기록 보관소에서 특정 검색어에 대한 PDF 파일을 다운로드하고 싶습니다. 예를 들어 '베트남'의 경우 URL은 다음과 같습니다.https://www.cia.gov/library/readingroom/search/site/Vietnam.
PDF 파일은 각 링크를 클릭한 후 볼 수 있습니다. 프로그래밍 방식으로 PDF 파일을 다운로드하도록 수정할 수 있습니까?wget -A pdf https://www.cia.gov/library/readingroom/search/site/Vietnam
감사합니다!
답변1
어쩌면 이것이 도움이 될 것입니다!
먼저 모든 다운로드 파일이나 URL을 텍스트 파일에 저장합니다.
$ cat > 다운로드 파일 list.txt
URL 1
URL 2
URL 3
URL 4
echo "텍스트를 입력하세요"
텍스트=$1
고양이 URL.txt | grep -i $text > /tmp/new.txt
wget -i /tmp/new.txt