오프라인 사본을 얻기 위해 전체 위키피디아를 다운로드하고 싶습니다. 다음 명령을 사용해 보았습니다.
wget --recursive --domains --convert-links --no-clobber https://it.wikipedia.org/wiki/
하지만 첫 번째 페이지만 다운로드됩니다. 어떻게 사용하나요?
답변1
위키피디아의robots.txt
포함되지 않습니다 wget
:
#
# Sorry, wget in its recursive mode is a frequent problem.
# Please read the man page and use it properly; there is a
# --wait option you can use to set the delay between hits,
# for instance.
#
User-agent: wget
Disallow: /
그들의 조언을 따르십시오. 특히 다음과 같은 도구를 사용하여 Wikipedia를 wget
다운로드해서는 안 됩니다.오프라인 데이터베이스 다운로드대신에.