개행 문자 뒤의 텍스트를 가져오는 방법

Question 1

pcregrepUltiline 모드와 캡처 그룹의 내용을 출력하는 기능이 있습니다 M.o

$ pcregrep -Mo1 -o2 -o3 --om-separator ' ' '^(1)\n(.*)\n\h*Usd(\H+)' file
1 Something here and else, 2000 edf, 60 pop 324.32

Answer

pcregrepUltiline 모드와 캡처 그룹의 내용을 출력하는 기능이 있습니다 M.o

$ pcregrep -Mo1 -o2 -o3 --om-separator ' ' '^(1)\n(.*)\n\h*Usd(\H+)' file
1 Something here and else, 2000 edf, 60 pop 324.32

Question 2

"1"과 선택적 공백만 포함하는 줄로 시작하는 세 줄을 연결하고 수정하려면 다음을 수행하세요.

$ perl -0777ne '/^1\s+(.*?)\h*\n\h*Usd(\H+)/imsg && printf "1 %s %s\n", $1, $2' input.txt
1 Something here and else, 2000 edf, 60 pop 324.32

이 -0777옵션은 Perl이 한 번에 한 줄씩 읽는 대신 전체 파일을 한 번에 읽도록 지시합니다. -n유사한 방식으로 입력을 처리하도록 지시합니다 sed -n. -ePerl에게 다음 인수가 스크립트임을 알려줍니다.

정규식이 텍스트와 일치하면 RE 캡처 그룹에서 캡처한 텍스트를 원하는 형식으로 인쇄합니다.

"선택적 후행 공백"을 일치시키는 것은 귀하의 질문에서 복사하여 붙여넣은 예제 파일에 여러 줄에 후행 공백 문자가 있다는 사실을 처리하는 것입니다. 이것이 원본 파일에 있었는지 아니면 질문에 붙여 넣은 인공물인지는 알 수 없습니다. 중요하지 않습니다. 스크립트는 후행 공백이 있는지 여부에 관계없이 동일한 방식으로 작동합니다.

숫자와 선택적 공백만 포함하는 줄로 시작하는 세 줄의 그룹을 결합하고 수정하려면 다음을 수행하세요.

$ perl -n -e 'if (/^\d+\s*$/) {
     chomp; $_ .= " " . <>;
     chomp; $_ .= " " . <>;
     s/\s{2,}/ /g;
     s/Usd(\H+).*/$1/i;
     print
   }' input.txt
1 Something here and else, 2000 edf, 60 pop 324.32
2 21st New tetx that will like to select with pattern, 334 pop 162.14

줄에 선택적 후행 공백이 있는 숫자만 포함될 때마다 다음 두 줄을 가져와 현재 줄에 추가한 다음 수정하고 인쇄합니다.

chomp각 줄 끝에서 개행 문자를 제거 하고 <>다음 입력 줄을 읽습니다. 다음 두 줄을 가져와 추가하기 위해 두 번 실행됩니다. 그런 다음 연결된 줄을 두 가지 작업으로 수정합니다 s///(첫 번째 작업은 두 개 이상의 공백 문자를 단일 공백으로 줄이고, 두 번째 작업은 첫 번째 "Usd\H+" 뒤의 줄에서 모든 항목을 제거하고 리터럴 문자열 "Usd"도 제거합니다. 인쇄하기 전에 마지막 작업이 완료됩니다(대소문자 구분 안 함).

\h수평 공백 문자와 일치하는 Perl 정규식입니다. \H반대입니다. 어떤 것과도 일치합니다.아니요수평 공백.

이 두 가지 perl one-liner는 원본 샘플 데이터와 편집된 질문의 업데이트된 예제에서 작동하고 동일한 출력을 생성합니다.

Answer

"1"과 선택적 공백만 포함하는 줄로 시작하는 세 줄을 연결하고 수정하려면 다음을 수행하세요.

$ perl -0777ne '/^1\s+(.*?)\h*\n\h*Usd(\H+)/imsg && printf "1 %s %s\n", $1, $2' input.txt
1 Something here and else, 2000 edf, 60 pop 324.32