HTML 페이지에서 텍스트 추출

HTML 페이지에서 텍스트 추출

HTML 페이지에서 텍스트를 추출하기 위해 xidel 명령을 사용하고 있습니다. 이게 내 코드야

  xidel  http://www.ip-adress.com/ip_tracer/8.8.8.8 --extract "<table>
  <tbody>
 <tr>
 <td>
 <table>
 <tbody>
  <tr> </tr>
 <template:loop>
  <tr> <th> {$field1} </th> <td> ${field2} </td> </tr>
  </template:loop>
  </tbody>
   </table>
   </td>
   <td> </td>
    </tr>
    </tbody>
     </table>
       " 

템플릿 방식을 사용하고 있습니다. 이 코드를 실행할 때. 터미널에 오류나 출력이 표시되지 않습니다. 이 코드를 실행한 후 얻은 결과입니다.

    **** Retrieving (GET): http://www.ip-adress.com/ip_tracer/8.8.8.8 ****
    **** Processing: http://www.ip-adress.com/ip_tracer/8.8.8.8 ****
     ** Current variable state: **

$ 프롬프트를 반환합니다. 출력이 어떤 변수에 저장되어 있는지 알고 싶습니다.

답변1

이것for 주어진 것은 xidel표준 출력에 기록한다는 것을 나타냅니다. 이 정보를 캡처하려면 표준 출력을 파일이나 자체 쉘 변수로 리디렉션해야 합니다.

예를 들어, 예제 10에서는 bash에서 변수를 설정하기 위해 다음을 수행합니다.

eval "$(xidel http://site -e 'title:=//title' -e 'links:=//a/@href' --output-format bash)"

예제 하단에 다음을 가리키는 주석이 있습니다.읽어보기 파일( xidel분명히 그러한 문서).

관련 정보