나는 wget을 사용하여 내가 제어할 수 없는 웹 서버에서 디렉토리 구조를 복사하고 있습니다. 나는 이 웹 페이지에 있는 각 리소스의 내용에는 관심이 없으며 단지 웹 서버의 구조를 반영하기 위한 디렉터리와 파일을 만들고 싶습니다. 기본적으로 가능한 한 비어 있는 많은 파일이 포함된 많은 디렉터리를 만듭니다(파일당 몇 바이트는 문제가 되지 않습니다).
wget을 사용하여 이 작업을 수행할 수 있습니까?
답변1
해결 방법을 사용하여 해결했습니다. 이미지를 사용하여 한 터미널에서 wget을 통해 다운로드한 다음 두 번째 터미널에서 이 oneliner를 실행하세요.
while true ; do date; time find /tmp/test/ -type f -exec cp /dev/null {} \; ; sleep 36000; done
그러면 기존 파일이 모두 지워지고 10시간 동안 일시 중지된 후 다시 실행됩니다. 내 목적에는 "충분하다".
답변2
wget
--mirror에 대한 매뉴얼 페이지 에 따르면 당신이 찾고 있는 것은 다음과 같습니다:
--mirror
Turn on options suitable for mirroring. This option turns on
recursion and time-stamping, sets infinite recursion depth and
keeps FTP directory listings. It is currently equivalent to -r -N
-l inf --no-remove-listing.
답변3
이 같은 것이 당신에게 효과가 있을까요?
wget --spider -r --no-parent http://your.url.com/
답변4
저도 같은 문제가 있습니다. wget -O - 'URL'
이것을 사용하면 빈 파일이 자동으로 삭제되고 문제가 해결됩니다.
wget -O - 'http://www.google.com'
-O
출력 파일 다운로드-
이 파일 삭제