컬 요청에서 html 텍스트를 grep하고 두 html 태그 사이의 값을 출력하는 방법이 있습니까?
좀 더 구체적으로 말하면, 양식의 입력 값은 무엇입니까?
답변1
일반 UNIX 명령(so 등)을 혼합하여 사용하여 curl
다운로드한 html의 내용을 읽을 수 있습니다. 이것을 읽는 정확한 방법은 양식의 특정 모양과 이를 해석하려는 방법에 따라 다릅니다.grep
awk
라이브러리가 있는 다른 언어를 사용하여 이 작업을 수행 할 수도 있으므로 perl
더 쉽습니다.
그러나 입력 양식에는 특정 사람이나 프로세스가 입력한 필드에만 내용이 있습니다.현지의POST(또는 가능성이 낮은 GET) 요청을 통해 제출하기 전에.
입력 양식은 분명히 기본값을 가질 수 있지만, 귀하가 묻는 것은 채워진 양식에서 데이터를 어떻게든 추출할 수 있는지 묻는 것 같습니다. 그리고 대답은 컬에서 나오지 않습니다. 왜냐하면 컬이 웹 서버에 웹을 요청하기 때문입니다. 페이지를 클릭하면 빈 양식이 표시됩니다.
아마도 당신이 달성하고 싶은 것이 무엇인지 명확히 할 수 있을 것입니다.
답변2
가지다
- HTML 강아지
- xhtml/xml용 xpup(CSS 선택기 대신 xpath 사용)
그들은 다음에서 영감을 받았습니다.JSON 파서 JQ 유사한 구문과 동작을 제공합니다.
curl -s https://news.ycombinator.com/ | pup 'table table tr:nth-last-of-type(n+2) td.title a attr{href}'