sudo wget -O /home/KrypticRelic/Desktop/DefaultAccess.txt phenoelit.org/dpl/dpl.html
이렇게 하면 내가 원하는 실제 텍스트로 많은 양의 패딩이 인쇄됩니다.
전임자.
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN">
<html><head><title>Default Password List</title></head>
<body bgcolor="#000000" link=#FF6600 vlink=#CC6600 alink=#FFFF00 text=#FF9900 >
<CENTER><H1>Default Password List</H1><h2>2007-07-03 </h2>
<TABLE FRAME=VOID CELLSPACING=0 COLS=47 RULES=NONE BORDER=0>
<COLGROUP><COL WIDTH=177><COL WIDTH=348><COL WIDTH=472><COL WIDTH=292><COL WIDTH=150><COL WIDTH=399><COL WIDTH=429><COL WIDTH=841><COL WIDTH=34><COL WIDTH=94><COL WIDTH=66><COL WIDTH=208><COL WIDTH=48><COL WIDTH=48><COL WIDTH=45><COL WIDTH=51><COL WIDTH=86><COL WIDTH=34><COL WIDTH=79><COL WIDTH=71><COL WIDTH=208><COL WIDTH=48><COL WIDTH=41><COL WIDTH=41><COL WIDTH=40><COL WIDTH=86><COL WIDTH=34><COL WIDTH=59><COL WIDTH=66><COL WIDTH=208><COL WIDTH=48><COL WIDTH=48><COL WIDTH=65><COL WIDTH=40><COL WIDTH=86><COL WIDTH=34><COL WIDTH=74><COL WIDTH=171><COL WIDTH=86><COL WIDTH=45><COL WIDTH=48><COL WIDTH=48><COL WIDTH=51><COL WIDTH=119><COL WIDTH=28><COL WIDTH=64><COL WIDTH=71></COLGROUP>
<TBODY>
<TR>
<TD WIDTH=177 HEIGHT=17 ALIGN=LEFT>Vendor</TD>
<TD WIDTH=348 ALIGN=LEFT>Model</TD>
<TD WIDTH=472 ALIGN=LEFT>Version</TD>
<TD WIDTH=292 ALIGN=LEFT>Access Type</TD>
<TD WIDTH=150 ALIGN=LEFT>Username</TD>
<TD WIDTH=399 ALIGN=LEFT>PASSWORD</TD>
<TD WIDTH=429 ALIGN=LEFT>Privileges</TD>
<TD WIDTH=841 ALIGN=LEFT>Notes</TD>
HTML을 제거하고 목록을 유지하려면 어떻게 해야 합니까? 제가 말하는 내용을 보실 수 있도록 위에 웹사이트가 제공되어 있습니다.
답변1
삭제된 HTML을 다운로드하려면 links
(또는 lynx
) 및 -dump
옵션을 사용하십시오.
links -dump http://website.web
또는:
lynx -dump http://website.web
둘의 출력 스타일이 다릅니다. 첫째, lynx
하이퍼참조를 무시하면서 형식을 지정합니다 links
.
설치하다
Debian/Ubuntu와 같은 시스템에서는 다음 명령을 사용하여 두 프로그램 중 하나를 설치할 수 있습니다 apt-get
.
apt-get install links
apt-get install lynx