문서 링크가 포함된 웹페이지가 있습니다. 다음 명령을 사용하여 문서를 다운로드할 수 있습니다.
wget -r -A.doc www.website.com/1.doc
wget
하지만 문서가 포함된 페이지에 대한 링크와 문서 링크를 스캔하여 다운로드할 수 있는 링크를 제공하고 싶습니다 .
wget
문서 유형에서 특정 링크를 검색하는 방법이 있습니까 ?
답변1
이와 같은 것이 효과가 있을 수 있습니다.
wget -r -l 2 -A doc,docx,odt http://example.com/page-to-scan.html
재귀적으로 페이지 가져오기http://example.com/page-to-scan.html그리고 해당 페이지의 모든 링크를 클릭하고 모든 콘텐츠를 다음 단계로 가져오세요. 그런 다음 .doc, .docx 또는 .odt로 끝나지 않는 모든 항목을 버리십시오(docs를 언급하셨으므로 MS Legacy, MS Current 및 Open|Libre Office의 3가지 유형이 있습니다).