HTML에서 텍스트 추출

HTML에서 텍스트 추출

나는 가지고있다이 페이지. HTML 페이지에서 특히 테이블 제목( th)과 테이블 데이터( ) 의 텍스트를 추출하고 싶습니다 td. 예를 들어:

국가: 미국(US),주: 캘리포니아여기서 th= 국가 및 td= 미국(US).

이것은 다음을 사용하여 얻을 수 있는 가장 가까운 결과입니다 xidel.

xidel -A  "Mozilla/5.0" http://www.ip-tracker.org/locator/ip-lookup.php ip=8.8.8.8 -e 'th[1] td[1]'

HTML 페이지에서 모든 항목 th과 테이블 항목을 추출하는 방법은 무엇입니까?td

관련 정보