나는 curl
HTML 페이지 작업에 명령줄을 사용하는 것을 좋아합니다.
상대 URL은 고통스럽습니다.
모든 상대 URL을 절대 URL로 만드는 간단한 유틸리티가 있습니까?
이상적으로는 다음과 같습니다
curlabsolute $URL | process
답변1
당신에게 필요한 것은wget
실용적인 사항:
주어진 간단한 웹 페이지를 다운로드해야 한다고 가정해 보겠습니다 http://www.littlewebhut.com/articles/simple_web_page/
.
명령(아래에 사용됨URLtrue이면 명령을 "있는 그대로" 테스트할 수 있습니다.)
wget -O simple_page -k http://www.littlewebhut.com/articles/simple_web_page/
-O
(--output-document=file
) - 해당 파일에 문서가 기록되지 않고, 모든 문서가 연결되어 기록됩니다file
.-k
(--convert-links
) - 다운로드가 완료된 후 문서의 링크를 로컬 보기에 적합하도록 변환합니다.
위 웹페이지의 일부 상황에 맞는 HTML 스니펫을 보여드리겠습니다.앞으로다운로드(온라인 버전):
...
<ul>
<li><a href="/" class="color-menu">Home</a></li>
<li><a href="/html/" class="color-menu">HTML</a></li>
<li><a href="/css/" class="color-menu">CSS</a></li>
<li><a href="/javascript/" class="color-menu">JavaScript/jQuery</a></li>
<li><a href="/inkscape/" class="color-menu">Inkscape</a></li>
<li><a href="/gimp/" class="color-menu">GIMP</a></li>
<li><a href="/blender/" class="color-menu">Blender</a></li>
<li><a href="/articles/" class="color-menu">Articles</a></li>
<li><a href="/contact/" class="color-menu">Contact</a></li>
</ul>
동일한 조각뒤쪽에다운로드하여 파일에 저장 simple_page
:
...
<ul>
<li><a href="http://www.littlewebhut.com/" class="color-menu">Home</a></li>
<li><a href="http://www.littlewebhut.com/html/" class="color-menu">HTML</a></li>
<li><a href="http://www.littlewebhut.com/css/" class="color-menu">CSS</a></li>
<li><a href="http://www.littlewebhut.com/javascript/" class="color-menu">JavaScript/jQuery</a></li>
<li><a href="http://www.littlewebhut.com/inkscape/" class="color-menu">Inkscape</a></li>
<li><a href="http://www.littlewebhut.com/gimp/" class="color-menu">GIMP</a></li>
<li><a href="http://www.littlewebhut.com/blender/" class="color-menu">Blender</a></li>
<li><a href="http://www.littlewebhut.com/articles/" class="color-menu">Articles</a></li>
<li><a href="http://www.littlewebhut.com/contact/" class="color-menu">Contact</a></li>
</ul>