저는 정규식과 검색 패턴을 잘 다루지 못해서 어디서부터 시작해야 할지 잘 모르겠습니다.
<td id="latest_button">
test.txt에서 다음 50자를 찾아 반환 해야 합니다 . bash 스크립트를 대상으로 하기 때문에 다른 언어는 어려울 것입니다.
답변1
나는 보통 이것을 달성하기 위해 grep -o를 사용합니다.
grep -o '<td id="latest_button">..................................................'
또는 확장 모드를 사용하세요.
grep -E -o '<td id="latest_button">.{50}'
물론 라벨 자체도 얻을 수 있습니다.
답변2
당신이 하려는 것처럼 html을 파싱하는 것이 최선의 아이디어인지는 모르겠지만 어쨌든 개행 문자가 있으면 작동합니다. 그렇지 않으면 tr 부분을 제거할 수 있습니다.
cat yourFile.html | tr -d '\n' | awk -F'<td id="latest_button">' '{print $2}' | cut -c -50
따라서 tr은 개행 문자를 제거하고 모든 것을 하나의 행 문자열로 처리합니다.
awk -F 구분 기호를 레이블에 설정하고 $2 를 인쇄하고 구분 기호 뒤의 부분을 인쇄합니다.
cut -c -50 처음 50자만 인쇄합니다.