AWK, SED 또는 GREP는 HTML 파일에서 데이터를 추출하는 데 사용됩니다.

Question 1

매우 우아하지는 않지만 다음을 수행할 수 있습니다.

sed -ne 's/.*"test-summary".* \([0-9][0-9]* right [^&].*exceptions\)&nbsp.*/\1/p'

예를 들어:

$ echo '<script>document.getElementById("test-summary").innerHTML = "<strong>Test Pages:</strong> 1 right, 0 wrong, 0 ignored, 0 exceptions&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;' | sed -ne 's/.*"test-summary".* \([0-9][0-9]* right,[^&].*exceptions\)&nbsp.*/\1/p'
1 right, 0 wrong, 0 ignored, 0 exceptions

Answer

매우 우아하지는 않지만 다음을 수행할 수 있습니다.

sed -ne 's/.*"test-summary".* \([0-9][0-9]* right [^&].*exceptions\)&nbsp.*/\1/p'

예를 들어:

$ echo '<script>document.getElementById("test-summary").innerHTML = "<strong>Test Pages:</strong> 1 right, 0 wrong, 0 ignored, 0 exceptions&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;' | sed -ne 's/.*"test-summary".* \([0-9][0-9]* right,[^&].*exceptions\)&nbsp.*/\1/p'
1 right, 0 wrong, 0 ignored, 0 exceptions

Question 2

그리고 :grepawk

grep 'document.getElementById("test-summary")' file.html | awk -F'</strong>|&' '{print $2}'

Answer

그리고 :grepawk

grep 'document.getElementById("test-summary")' file.html | awk -F'</strong>|&' '{print $2}'

AWK, SED 또는 GREP는 HTML 파일에서 데이터를 추출하는 데 사용됩니다.

답변1

답변2

관련 정보