html 태그에서 데이터를 추출하기 위해 bash 스크립트를 작성 중인데 다른 스레드에서 이 명령을 찾았는데 grep -o '<tr>.*</tr>' HTMLFILE | sed 's/\(<tr>\|<\/tr>\)//g' > NEWFILE
제대로 작동합니다.
하지만 태그의 링크에서 이름을 추출하고 싶습니다 . <a>
예를 들어 <a href="www.mywebsite.com?name="What_I_Want_To_Extract">
이 문제로 어려움을 겪고 있지만 다음 명령을 적용할 수 없습니다. 도움이 필요하십니까?
답변1
grep -oP 'name="\K[^"]*' filename
산출:
What_I_Want_To_Extract
바라보다:http://www.charlestonsw.com/perl-regular-expression-k-trick/
귀하의 버전이 조정되었습니다:
grep -o 'name=".*">' HTMLFILE | sed 's/name="\|">//g' NEWFILE