OS X의 sed - 대괄호 사이의 모든 텍스트를 추출합니다.

Question 1

awk도 이에 적합합니다.[ 또는 ]필드 구분 기호로 각각 인쇄우수대지:

awk -F '[][]' '{for (i=2; i<=NF; i+=2) {printf "%s ", $i}; print ""}' file

sed를 사용하여 다음과 같이 작성합니다.

sed -E 's/(^|\])[^[]*($|\[)/ /g' file

Answer

awk도 이에 적합합니다.[ 또는 ]필드 구분 기호로 각각 인쇄우수대지:

awk -F '[][]' '{for (i=2; i<=NF; i+=2) {printf "%s ", $i}; print ""}' file

sed를 사용하여 다음과 같이 작성합니다.

sed -E 's/(^|\])[^[]*($|\[)/ /g' file

Question 2

이는 첫 번째(왼쪽) 대괄호 안의 모든 항목을 여러 번 뒤에 오는 첫 번째(오른쪽) 대괄호와 일치시킵니다.

$ sed 's/[^[]*\[\([^]]*\)\][^[]*/\1 /g' file
foo bar
gar har
uf gc br

설명하다:

sed '                      # start a sed script
        s/                 # start a substitute command
        [^[]*              # match all leading characters (except [)
        \[                 # match an explicit [
        \([^]]*\)          # capture text inside brackets.
        \]                 # match the closing ]
        [^[]*              # match trailing text (if any).
        /\1 /              # replace everything matched by the captured text.
        g                  # repeat for all the line.
       ' file              # close script. Apply to file.

이렇게 하면 각 일치 항목에 후행 공백이 추가됩니다. 삭제해야 하는 경우 끝에 delete를 추가하세요.

sed -e 's/[^[]*\[\([^]]*\)\][^[]*/\1 /g' -e 's/ $//' file

GNU grep이 있으면 도움이 될 수 있습니다(한 번에 한 줄씩 캡처).

grep -Po '\[\K[^]]*(?=])'

그리고 위의 방법이 작동하지 않으면 awk도 작동할 수 있습니다.

awk '{print gensub(/\[([^]]*)\][^[]*/,"\\1 ","g")}' file

Answer

이는 첫 번째(왼쪽) 대괄호 안의 모든 항목을 여러 번 뒤에 오는 첫 번째(오른쪽) 대괄호와 일치시킵니다.

$ sed 's/[^[]*\[\([^]]*\)\][^[]*/\1 /g' file
foo bar
gar har
uf gc br

설명하다:

sed '                      # start a sed script
        s/                 # start a substitute command
        [^[]*              # match all leading characters (except [)
        \[                 # match an explicit [
        \([^]]*\)          # capture text inside brackets.
        \]                 # match the closing ]
        [^[]*              # match trailing text (if any).
        /\1 /              # replace everything matched by the captured text.
        g                  # repeat for all the line.
       ' file              # close script. Apply to file.

이렇게 하면 각 일치 항목에 후행 공백이 추가됩니다. 삭제해야 하는 경우 끝에 delete를 추가하세요.

sed -e 's/[^[]*\[\([^]]*\)\][^[]*/\1 /g' -e 's/ $//' file

GNU grep이 있으면 도움이 될 수 있습니다(한 번에 한 줄씩 캡처).

grep -Po '\[\K[^]]*(?=])'

그리고 위의 방법이 작동하지 않으면 awk도 작동할 수 있습니다.

awk '{print gensub(/\[([^]]*)\][^[]*/,"\\1 ","g")}' file

Question 3

관용적인 접근 방식은 Lookaround 어설션을 사용하는 것입니다.https://www.regular-expressions.info/lookaround.html, 그러나 sed는 이를 지원하지 않으며 PCRE 호환 정규식 프로세서에서만 지원합니다.

Perl은 기본적으로 macOS에서 사용할 수 있어야 하므로 이것이 실행 가능한 대안일 수 있습니다.

Perl을 사용하면 다음과 같이 말할 수 있습니다.

perl -pe 's/.+?(?<=\[)(.+?)(?=\]).+?/$1 /g'

(줄 끝에 공백이 추가됩니다.)

이 패턴에 대한 설명은 다음을 참조하세요.https://regexr.com/41gi5.

Answer