http 응답을 사용하여 splunk.com의 하위 도메인을 찾는 방법은 무엇입니까?

http 응답을 사용하여 splunk.com의 하위 도메인을 찾는 방법은 무엇입니까?

이 명령을 사용하여 "splunk.com"에 http 요청을 보냈습니다.

curl -L splunk.com

HTML 코드가 있습니다. HTML 코드를 분석하여 웹사이트의 하위 도메인을 찾고 싶습니다.

HTML 코드의 일부

답변1

복잡한 구문 분석/수정xmlstarlet,xmllint그리고sed도구:

curl -sL "http://splunk.com" | xmlstarlet fo --html --recover 2>/dev/null \
| xmllint --html --xpath "//a[contains(@href, '.splunk.com') and not(contains(@href, '//www.'))]/@href" - 2>/dev/null \
| tr ' ' '\n' | sed -E 's~^href="https?:[/]+~~; s/\.com.*$/.com/' | sort -u

산출:

answers.splunk.com
conf.splunk.com
dev.splunk.com
docs.splunk.com
investors.splunk.com
live.splunk.com
login.splunk.com
splunkbase.splunk.com
splunklive.splunk.com
usergroups.splunk.com

관련 정보