Unix 명령에서 이스케이프 구분 기호를 피하는 방법은 무엇입니까?

Question 1

처리하기 전에 이스케이프 구분 기호를 다른 것으로 변경하십시오 awk. 이는 다음을 통해 수행할 수 있습니다 sed.

$ cat test.out| sed 's/\\~/=/g' | \
    awk -F'~' 'BEGIN {sum=0} {sum+=$4} END{print sum}'
4000

그리고 흔히 그렇듯이 다음을 수행할 필요도 없습니다 cat.

$ sed 's/\\~/=/g' test.out | awk -F'~' 'BEGIN {sum=0} {sum+=$4} END{print sum}'

Answer

처리하기 전에 이스케이프 구분 기호를 다른 것으로 변경하십시오 awk. 이는 다음을 통해 수행할 수 있습니다 sed.

$ cat test.out| sed 's/\\~/=/g' | \
    awk -F'~' 'BEGIN {sum=0} {sum+=$4} END{print sum}'
4000

그리고 흔히 그렇듯이 다음을 수행할 필요도 없습니다 cat.

$ sed 's/\\~/=/g' test.out | awk -F'~' 'BEGIN {sum=0} {sum+=$4} END{print sum}'

Question 2

사용되지 않는 대안은 다음과 같습니다 awk.

$ sed 's/\\~/=/g' test.out | cut -d"~" -f4 | paste -sd+ | bc
4000

위의 코드는 세 번째 열에서 이스케이프된 물결표를 sed바꿉니다 . \~그런 다음 cut를 사용하여 숫자의 네 번째 열을 선택하고 더하기 기호( )로 구분되도록 다시 구성 할 수 있습니다 +.

$ sed 's/\\~/=/g' test.out | cut -d"~" -f4 | paste -sd+
1000+2000+1000

그런 다음 이 문자열은 이진 계산기에 입력되어 bc합계를 냅니다.

Answer

사용되지 않는 대안은 다음과 같습니다 awk.

$ sed 's/\\~/=/g' test.out | cut -d"~" -f4 | paste -sd+ | bc
4000

위의 코드는 세 번째 열에서 이스케이프된 물결표를 sed바꿉니다 . \~그런 다음 cut를 사용하여 숫자의 네 번째 열을 선택하고 더하기 기호( )로 구분되도록 다시 구성 할 수 있습니다 +.

$ sed 's/\\~/=/g' test.out | cut -d"~" -f4 | paste -sd+
1000+2000+1000

그런 다음 이 문자열은 이진 계산기에 입력되어 bc합계를 냅니다.

Question 3

이스케이프를 처리하기 위한 일반적인 접근 방식은 perl역추적 연산자 없이 PCRE와 교대 정규식 연산자를 결합하는 것입니다. GNU는 다음과 같습니다 grep.

grep -Po '(?>(?:\\.|.)*?~){3}\K(?:\\.|[^~])*' << \EOF
1~CEO~ashok\~kumar~1000
2~CFO~Ranjan~2000
3~CEO~kumar~1000
4~field2~field3\\~10000~field5-note-the-escaped-backslash-not-tilde
5~a\~b\~c\~no-4th-field-here
EOF

이것은 만든다:

(평상시 에 추가할 수 있습니다 awk '{s+=$0};END{print s}').

GNU를 사용하면 sed다음과 같은 작업도 수행할 수 있습니다.

sed -rn 's/((\\.|[^\~])*~){3}((\\.|[^~])*).*/\3/p'

GNU를 사용하면 필드를 이스케이프 문자나 물결표가 아닌 문자 또는 백슬래시 문자의 시퀀스로 정의 awk할 수 있습니다 .FPAT

awk -v FPAT='(\\\\.|[^\\\\~])*' '{print $4}'

Answer