텍스트 파일의 첫 번째 HTML과 일치하는 정규식을 만들려고 합니다.
garbage
garbage
§<html class="test1">
<div>test</div></html>§
garbage
garbage
§<html class="test2>
<div>test</div></html>§
garbage
garbage
§<html class="test3">
<div>test</div></html>§
garbage
garbage
먼저 regex101.com에서 이와 같은 것을 시도했습니다.
<html.*?html>
PCRE2 및 단일 와이어 모드를 사용하면 정상적으로 작동합니다. 그런 다음 "dot match new line" 옵션이 활성화된 Notepad++를 사용하여 Windows에서 시도해 보았는데 거기에서도 잘 작동했습니다.
이제 Arch Linux에서 pcre2grep을 사용하여 동일한 작업을 수행하려고 하며 다음 정규식을 시도했습니다.
pcre2grep -o '(?s)<html.*?html>' test.txt
하지만 작동하지 않으며 왜 "(?s)" 수정자가 PCRE2_DOTALL을 활성화해야 하는지 알 수 없습니다. pcre2grep을 사용하여 동등한 정규식을 어떻게 만들 수 있습니까?