wget
파일을 다운로드 하고 이름을 지정 하면 궁금합니다. .asp
아니면 .php
웹페이지를 다운로드한다는 뜻인가요? 실행파일이 아닌가요?
그렇다면, .asp
또는 파일을 다운로드한 후 파일 .php
로 변환할 수 있나요 ?.html
답변1
이러한 파일에는 이름이 지정되어 있지만 .asp
실제로는 HTML 파일입니다. 이를 확인하려면 해당 콘텐츠를 확인하세요. 하지만 확장 기능이 .asp
이 특정 사이트를 구현하는 데 사용되는 기술이므로 확장 기능을 사용하세요. 이는 브라우저가 파일을 다운로드할 때 사용하는 이름이므로 파일을 디스크에 쓸 때 사용하는 이름이지만 여전히 HTML입니다.
다음 명령을 사용하여 파일 유형을 확인할 수도 있습니다 file
.
$ file some.asp
이전 질문에서 w3school 웹사이트(이 페이지를 책으로 다운로드할 수 있나요?). 다음 명령을 표시했습니다.
$ wget -r -np -nH -p -k http://www.w3schools.com/sql/default.asp
이 명령을 실행할 때 생성된 파일의 결과를 기록해 두십시오.
$ file ./sql/sql_func_count.asp
./sql/sql_func_count.asp: HTML document, ASCII text, with very long lines, with CRLF line terminators
그렇다면 이것은 버그입니다 wget
. 그렇죠?
아니요! 이것은 버그가 아니며 단지 작동 방식 wget
과 curl
동작일 뿐입니다. 이것이 httrack
위에 링크된 다른 Q&A에서 사용하도록 지시한 이유 중 일부입니다. 생성된 결과를 보면 파일 이름 .html
앞에는 모두 httrack
. wget
가 curl
붙고 URL에 있는 파일 이름은 액세스할 때 다운로드되는 실제 파일 이름이므로 존중된다는 것을 알 수 있습니다. URL에는 실제로 확장 개념이 없으며 OS주의입니다. URL은 URL(Uniform Resource Locator)입니다.
URL은 나중에 사용하기 위해 로컬에 저장하는 것이 아니라 인터넷에서 콘텐츠를 고유하게 찾도록 설계되었습니다. 이러한 목적으로 온라인 콘텐츠를 다운로드하려면 실제로 해당 콘텐츠를 로컬로 미러링하고 로컬에서 탐색할 수 있게 만드는 도구를 사용해야 합니다.
httrack
이와 같은 도구는 로컬에 저장된 콘텐츠를 오프라인으로 탐색할 수 있도록 하기 위해 본질적으로 URL 일관성을 위반합니다. 이런 일이 발생하도록 유도하는 wget
것이 가능 curl
하지만 일반적으로 더 번거롭고 오류가 발생하기 쉬우므로 일반적으로 사용하지 않는 것이 좋습니다.
작업에 적합한 도구를 사용하는 것이 가장 좋습니다. 온라인 콘텐츠를 로컬로 미러링하는 데 httrack
적합한 도구입니다!
답변2
아니요, 말씀하신 파일 확장자는 스크립트 파일입니다. 프로그램처럼 실행되는 파일입니다. 웹 페이지에서 클릭하면 실행되어 웹 사이트를 탐색할 때 얻는 효과를 생성합니다.