가능한 해결 방법으로또 다른 문제, 만들 수 있나요?wget
인쇄대상 문서에서 찾은 URL페이지 요구 사항으로 간주됩니까?나는 내가 하고 있는 간단한 작업을 위해 스크래핑 코드를 작성하고 싶지 않습니다.
답변1
다음을 수행할 수 있습니다.
wget -nv -p -nd --delete-after <url>
그러면 다음과 같이 출력됩니다.
2017-06-01 21:37:41 URL:<url> [19101] -> "index.html.3" [1]
2017-06-01 21:37:42 URL:<url>robots.txt [24/24] -> "robots.txt" [1]
2017-06-01 21:37:42 URL:<url>rc/1502.css [19106/19106] -> "1502.css" [1]
2017-06-01 21:37:42 URL:<url>favicon.ico [5390/5390] -> "favicon.ico" [1]
2017-06-01 21:37:42 URL:<url>avatar/nopic.jpg [893/893] -> "nopic.jpg
이를 귀하의 필요에 맞는 콘텐츠로 신속하게 변환하거나 필터링할 수 있습니다.