![모든 파일에서 URL 주소를 선택하고 출력하는 방법은 무엇입니까? [복사]](https://linux55.com/image/102470/%EB%AA%A8%EB%93%A0%20%ED%8C%8C%EC%9D%BC%EC%97%90%EC%84%9C%20URL%20%EC%A3%BC%EC%86%8C%EB%A5%BC%20%EC%84%A0%ED%83%9D%ED%95%98%EA%B3%A0%20%EC%B6%9C%EB%A0%A5%ED%95%98%EB%8A%94%20%EB%B0%A9%EB%B2%95%EC%9D%80%20%EB%AC%B4%EC%97%87%EC%9E%85%EB%8B%88%EA%B9%8C%3F%20%5B%EB%B3%B5%EC%82%AC%5D.png)
어떤 명령이 실행되는지 알고 싶습니다.
파일의 모든 URL을 선택하십시오(예: 처음부터 끝까지 http 또는 www로 시작하는 모든 주소를 식별하고 이를 텍스트 또는 기타 데이터와 분리하십시오).
.txt 파일로 출력합니다.
다음 아이디어는 .txt 파일에서 wget -i를 수행하는 것입니다. wget이 원본 파일의 모든 URL을 직접 인식하는 데 어려움을 겪기 때문에 이러한 URL을 선택하고 .txt 파일에서 올바르게 출력해야 합니다.
답변1
나는 다음의 지시를 따랐다.grep을 사용하고 스크립트를 삽입하여 HTML 파일에서 웹사이트 URL을 얻는 방법내 경우에는 URL이 입력 파일의 <href> 사이에 있었기 때문에 잘 작동했습니다.
grep -Po '(?<=href=")[^"]*(?=")' INPUT_FILE > OUTPUT_FILE.txt