awk를 사용하여 HTML 파일에서 URL을 추출하는 방법은 무엇입니까?

Question 1

왜 awk를 사용하나요? sed이것을 더 잘하세요:

sed -ne 's/.*\(http[^"]*\).*/\1/p' < foo.js

Answer

왜 awk를 사용하나요? sed이것을 더 잘하세요:

sed -ne 's/.*\(http[^"]*\).*/\1/p' < foo.js

Question 2

당신은 그것을 사용할 수 있습니다 grep. 큰따옴표를 포함하려면 다음을 수행합니다.

grep -o '"http://[^"]*"' myfile.html

큰따옴표를 제외하려면 다음을 수행하십시오.

grep -o 'http://[^"]*' myfile.html

편집하다

JavaScript 개체의 URL만 일치하도록 하려면 몇 가지 추가 필터링을 수행해야 할 수도 있습니다.

grep -o 'mp3: "http://[^"]*"' myfile.html | grep -o '"http://[^"]*"'

grep -o 'mp3: "http://[^"]*"' myfile.html | grep -o 'http://[^"]*'

Answer

당신은 그것을 사용할 수 있습니다 grep. 큰따옴표를 포함하려면 다음을 수행합니다.

grep -o '"http://[^"]*"' myfile.html

큰따옴표를 제외하려면 다음을 수행하십시오.

grep -o 'http://[^"]*' myfile.html

편집하다

JavaScript 개체의 URL만 일치하도록 하려면 몇 가지 추가 필터링을 수행해야 할 수도 있습니다.

grep -o 'mp3: "http://[^"]*"' myfile.html | grep -o '"http://[^"]*"'

grep -o 'mp3: "http://[^"]*"' myfile.html | grep -o 'http://[^"]*'

관련 정보