컬을 사용하여 받은 html 파일에서 다음 데이터를 추출하는 데 가장 적합한 것이 무엇인지 말해 줄 수 있는 사람이 있습니까?
<script>document.getElementById("test-summary").innerHTML = "<strong>Test Pages:</strong> 1 right, 0 wrong, 0 ignored, 0 exceptions
난 그냥 그 부분 이 필요 해요 1 right, 0 wrong, 0 ignored, 0 exceptions
. 다음 태그를 기반으로 합니다. document.getElementById("test-summary")
.이것은 몇 가지 테스트 결과이며 이 결과를 기반으로 몇 가지 논리를 만들어야 합니다.
누군가 이 작업을 수행하는 방법에 대해 조언을 해줄 수 있다면 매우 감사하겠습니다.
매우 감사합니다,
이스트반 카루터
답변1
매우 우아하지는 않지만 다음을 수행할 수 있습니다.
sed -ne 's/.*"test-summary".* \([0-9][0-9]* right [^&].*exceptions\) .*/\1/p'
예를 들어:
$ echo '<script>document.getElementById("test-summary").innerHTML = "<strong>Test Pages:</strong> 1 right, 0 wrong, 0 ignored, 0 exceptions ' | sed -ne 's/.*"test-summary".* \([0-9][0-9]* right,[^&].*exceptions\) .*/\1/p'
1 right, 0 wrong, 0 ignored, 0 exceptions
답변2
그리고 :grep
awk
grep 'document.getElementById("test-summary")' file.html | awk -F'</strong>|&' '{print $2}'