Wayback Machine(archive.org)의 다음 페이지에는 URL에 별표*가 있습니다. https://web.archive.org/web/*/https://www.nasa.gov/
CURL이나 wget 모두 페이지를 긁어내는 것을 허용하지 않습니다. 저는 최신 버전의 Linux Mint(2018)를 사용하고 있습니다.
PHP에서 wget 또는 CURL을 사용하여 URL에 별표 *가 있는 웹 페이지의 스냅샷을 얻는 방법, 구체적으로https://web.archive.org/web/*/https://www.nasa.gov/?
감사해요! httrack이 작동합니까?
편집: 웹사이트 web.archive.org/web/%2A/를 엽니다.https://www.nasa.gov브라우저에서. 그런 다음 wget 명령을 사용하여 본 것과 비교하십시오. 그들은 동일합니까? 나에게 wget 명령은 일반 페이지를 반환합니다.
답변1
URL을 따옴표로 묶으면 괜찮을 것 같습니다.
"경고: 와일드카드 문자는 HTTP에서 지원되지 않습니다" 메시지를 피하려면 가장 쉬운 방법은 별표를 별표로 바꾸는 것입니다.퍼센트 인코딩된 등가물:
wget "https://web.archive.org/web/%2A/https://www.nasa.gov"