AWK, SED 또는 GREP는 HTML 파일에서 데이터를 추출하는 데 사용됩니다.

AWK, SED 또는 GREP는 HTML 파일에서 데이터를 추출하는 데 사용됩니다.

컬을 사용하여 받은 html 파일에서 다음 데이터를 추출하는 데 가장 적합한 것이 무엇인지 말해 줄 수 있는 사람이 있습니까?

<script>document.getElementById("test-summary").innerHTML = "<strong>Test Pages:</strong> 1 right, 0 wrong, 0 ignored, 0 exceptions&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;

난 그냥 그 부분 이 필요 해요 1 right, 0 wrong, 0 ignored, 0 exceptions. 다음 태그를 기반으로 합니다. document.getElementById("test-summary").이것은 몇 가지 테스트 결과이며 이 결과를 기반으로 몇 가지 논리를 만들어야 합니다.

누군가 이 작업을 수행하는 방법에 대해 조언을 해줄 수 있다면 매우 감사하겠습니다.

매우 감사합니다,

이스트반 카루터

답변1

매우 우아하지는 않지만 다음을 수행할 수 있습니다.

sed -ne 's/.*"test-summary".* \([0-9][0-9]* right [^&].*exceptions\)&nbsp.*/\1/p'

예를 들어:

$ echo '<script>document.getElementById("test-summary").innerHTML = "<strong>Test Pages:</strong> 1 right, 0 wrong, 0 ignored, 0 exceptions&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;' | sed -ne 's/.*"test-summary".* \([0-9][0-9]* right,[^&].*exceptions\)&nbsp.*/\1/p'
1 right, 0 wrong, 0 ignored, 0 exceptions

답변2

그리고 :grepawk

grep 'document.getElementById("test-summary")' file.html | awk -F'</strong>|&' '{print $2}'

관련 정보