HTML 파서를 통해 HTML에서 값 추출 [중복]

HTML 파서를 통해 HTML에서 값 추출 [중복]

grep처음에는 HTML 파일에서 /를 직접 사용하는 방법 에 대해 문의했습니다 . awk몇 가지 피드백을 받았지만 사람들이 전체 HTML을 갖고 있지 않아 제안된 솔루션이 실패했다는 사실을 발견했습니다.

어떤 사람들은 HTML 구문 분석이 더 나은 선택이 될 것이라고 언급했습니다. 저는 표준 Linux/Debian Wheezy를 사용하여 Raspberry Pi를 작업하고 있습니다.

언급된 HTML은 여기에서 찾을 수 있습니다. 간단한 HTML입니다. 하지만 도움을 받으려면 전체 파일을 보는 것이 중요할 것 같습니다.

https://www.dropbox.com/s/9jdgzen2hwjxhjp/main.htm

따라서 수행해야 할 작업은 다음과 같습니다.

  • Pplus와 Pminus(18.0000과 0.00000) 두 값을 추출하여 제공하고, SUM을 제공합니다.
  • 두 값 모두 생성된 에너지 P-와 네트워크 P+에서 끌어온 에너지/전력을 제공하는 스마트 미터(에너지 미터)에서 나옵니다.
  • P - 태양이 있고 태양광 발전소가 작동하여 18W가 밤에 작동하는 경우 0.0000은 태양이 없으므로 전력이 생성되지 않음을 의미합니다. 단지 몇 가지 배경 정보를 제공하기 위한 것입니다.

원래 스레드에서 업데이트하고 지원 요청을 시도했지만 지난 며칠 동안 새로운 피드백이 없었기 때문에 더 이상 아무도 그것을 보지 못하는 것 같습니다. 나는 이제 이 질문을 여기 전문가들에게 다시 가져오려고 노력합니다.

답변1

이 샘플 HTML 파일을 확인하세요.

<DIV ID="idButtonDiv" STYLE="top:143px; left:0px;" ALIGN="CENTER">
<TABLE CELLSPACING="0" CELLPADDING="0" BORDER="0"><TR><TD ID="idButtonTd">
18.000

</TD></TR></TABLE>
</DIV>

파싱하기가 쉽지 않은 것 같습니다.

관련 정보