여러 줄의 시작 태그와 끝 태그를 사용하여 패턴별로 텍스트 가져오기 [중복]

Question 1

내 생각에 당신의 문제는 탐욕스럽지 않은 매치가 당신이 원하는 것보다 더 많이 먹어치울 수 있다는 것입니다.끝모래시작에스. 이것은 작동하는 것 같습니다:

grep -Pzo '(?s)START(?:(?!END).)*?bar(?:(?!START).)*?END' file.txt

예제의 모든 경우를 다루며, 완료한 경우>> file.txt

bar
START
test7
END

여전히 유효.

Answer

내 생각에 당신의 문제는 탐욕스럽지 않은 매치가 당신이 원하는 것보다 더 많이 먹어치울 수 있다는 것입니다.끝모래시작에스. 이것은 작동하는 것 같습니다:

grep -Pzo '(?s)START(?:(?!END).)*?bar(?:(?!START).)*?END' file.txt

예제의 모든 경우를 다루며, 완료한 경우>> file.txt

bar
START
test7
END

여전히 유효.

Question 2

레코드 구분 기호를 지정할 수 있는 경우 awk를 사용하겠습니다. 레코드 구분 기호가 "END"(한 줄에)인 경우 "bar"가 포함된 레코드를 찾습니다.

awk 'BEGIN {RS = ORS = "\nEND\n"} /bar/' file.txt

START 및 END 태그 사이에 나타나는 프로세스 텍스트입니다. 이 변경 사항은 해킹된 것처럼 느껴지지만 이 경우에는 작동합니다. END를 레코드 구분 기호로 사용하고 START 키워드 앞의 모든 텍스트를 제거합니다.

awk '
    BEGIN {RS = ORS = "\nEND\n"} 
    {sub(/^.*\nSTART\n/, "START\n")} 
    /bar/
' file.txt

END 앞에 "START"가 여러 번 나타나면 원하는 결과가 나오지 않을 수 있습니다.

foo
START
hello
START
bar
world
END
baz

다음과 같이 출력됩니다.

START
bar
world
END

Answer

레코드 구분 기호를 지정할 수 있는 경우 awk를 사용하겠습니다. 레코드 구분 기호가 "END"(한 줄에)인 경우 "bar"가 포함된 레코드를 찾습니다.

awk 'BEGIN {RS = ORS = "\nEND\n"} /bar/' file.txt

START 및 END 태그 사이에 나타나는 프로세스 텍스트입니다. 이 변경 사항은 해킹된 것처럼 느껴지지만 이 경우에는 작동합니다. END를 레코드 구분 기호로 사용하고 START 키워드 앞의 모든 텍스트를 제거합니다.

awk '
    BEGIN {RS = ORS = "\nEND\n"} 
    {sub(/^.*\nSTART\n/, "START\n")} 
    /bar/
' file.txt

END 앞에 "START"가 여러 번 나타나면 원하는 결과가 나오지 않을 수 있습니다.

foo
START
hello
START
bar
world
END
baz

다음과 같이 출력됩니다.

START
bar
world
END

Question 3

perl -nE 'BEGIN {$/="\nEND\n"} say /(START.*test.*)/s'

@bobbel이 지적했듯이 빈 줄 구분 기호를 피하려면 다음 say으로 바꾸십시오.print

Answer

perl -nE 'BEGIN {$/="\nEND\n"} say /(START.*test.*)/s'

@bobbel이 지적했듯이 빈 줄 구분 기호를 피하려면 다음 say으로 바꾸십시오.print

고쳐 쓰다: