무작위 벤치마크

Question 1

하나의 변수에 여러 단어를 포함하려면 스칼라 변수가 아닌 배열을 사용하고, 이를 이스케이프 연산자(필드 구분 기호 및 줄 연속의 경우)로 read처리 하려면 생략하세요. 이것이 기본값입니다. 다음 작업은 다음 작업이 아닙니다. 수행.\-rread

따라서 ksh/zsh/yash에서:

read -A fields; showargs "${fields[@]}"

또는 bash에서:

read -a fields; showargs "${fields[@]}"

( 기본적으로 공백, 탭 및 줄 바꿈(zsh에서는 nul)을 포함하는 문자 read분할에 유의하세요.)$IFS

$IFSzsh에서는 다른 Bourne 유사 셸에서와 마찬가지로 (니모닉: 가위처럼 보임)을 사용하여 따옴표 $=line가 없는 $line스칼라 변수 확장 문자 분할을 수행할 수 있습니다 . $=또는 $=~line다른 쉘에 의해 실행되는 전체 분할+glob의 경우 shellcheck가 경고합니다. 또는 현재 포함된 것 ${(s[ ])line}이상으로 공간을 명시적으로 분할합니다 . $IFS하지만 여기서는 백슬래시에는 도움이 되지 않습니다.

백슬래시(셸 구문 토큰화 및 따옴표 제거용)뿐만 아니라 임의의 셸 구문 따옴표를 처리 eval하려면@thrig의 훌륭한 답변zsh z및 Q매개변수 확장 플래그 정보. 하지만 빈 요소를 유지하려면 다음을 수행해야 합니다.

$ line='foo\ bar "" blah'
$ fields=( "${(Q@)${(z)line}}" )
$ typeset fields
fields=( 'foo bar' '' blah )

또는 Z[n]대체 z개행 문자도 명령 구분 기호 토큰 대신 토큰 구분 기호로 처리됩니다.

그럼에도 불구하고 이것은 단지 인용 처리가 아닌 전체 쉘 구문(이 경우 zsh 구문) 토큰화를 수행하는 것입니다. 예를 들어, 행은 예상한 것과는 다르게 a$(b c)<y>y<<<"a b"으로 표시됩니다 .fields=( 'a$(b c)' '<' y '>' y '<<<' 'a b' )fields=( 'a$(b' 'c)<y>y<<<a b' )

다차원 배열 및 데이터 (역)직렬화1를 지원하는 셸의 경우 ksh93을 참조하세요.

$ printf '%s\n' $'( (\'a b\' a) (\'b\\c\n\' d) )' | 
> ksh -c 'read -C a; typeset -p a; printf "<%s>\n" "${a[1][0]}"'
typeset -a a=(('a b' a) ($'b\\c\n' d) )
<b\c
>

내가 마지막으로 테스트했을 때(수년 전) 버그가 많았고 아마도 여전히 그럴 가능성이 높습니다. eval입력이 유효한 직렬화된 스트림이라는 보장이 없다면 .

오! 사실 아니다:

$ printf '%s\n' '( [`uname>&2`]=1 )' | ksh -c 'read -C a'
Linux

또한 JSON 문자열에는 NUL이 포함될 수 있지만 zsh 변수에만 NUL이 포함될 수 있습니다. 복잡한 데이터 구조를 처리하려면 쉘 대신 적절한 프로그래밍 언어를 사용하는 것이 더 합리적입니다.

^{1 기록에 따르면, AT&T는 개발 팀이 해체되기 전에 ksh93의 마지막 베타 버전을 출시했습니다. ksh2020(현재는 사용되지 않음)의 기반이 되는 ksh93도 JSON (역)직렬화에 대한 일부 실험적 지원을 제공했습니다. ksh2020에서 제거됨). 또한 CSV 입력/출력을 지원합니다.}

Answer

하나의 변수에 여러 단어를 포함하려면 스칼라 변수가 아닌 배열을 사용하고, 이를 이스케이프 연산자(필드 구분 기호 및 줄 연속의 경우)로 read처리 하려면 생략하세요. 이것이 기본값입니다. 다음 작업은 다음 작업이 아닙니다. 수행.\-rread

따라서 ksh/zsh/yash에서:

read -A fields; showargs "${fields[@]}"

또는 bash에서:

read -a fields; showargs "${fields[@]}"

( 기본적으로 공백, 탭 및 줄 바꿈(zsh에서는 nul)을 포함하는 문자 read분할에 유의하세요.)$IFS

$IFSzsh에서는 다른 Bourne 유사 셸에서와 마찬가지로 (니모닉: 가위처럼 보임)을 사용하여 따옴표 $=line가 없는 $line스칼라 변수 확장 문자 분할을 수행할 수 있습니다 . $=또는 $=~line다른 쉘에 의해 실행되는 전체 분할+glob의 경우 shellcheck가 경고합니다. 또는 현재 포함된 것 ${(s[ ])line}이상으로 공간을 명시적으로 분할합니다 . $IFS하지만 여기서는 백슬래시에는 도움이 되지 않습니다.

백슬래시(셸 구문 토큰화 및 따옴표 제거용)뿐만 아니라 임의의 셸 구문 따옴표를 처리 eval하려면@thrig의 훌륭한 답변zsh z및 Q매개변수 확장 플래그 정보. 하지만 빈 요소를 유지하려면 다음을 수행해야 합니다.

$ line='foo\ bar "" blah'
$ fields=( "${(Q@)${(z)line}}" )
$ typeset fields
fields=( 'foo bar' '' blah )

또는 Z[n]대체 z개행 문자도 명령 구분 기호 토큰 대신 토큰 구분 기호로 처리됩니다.

그럼에도 불구하고 이것은 단지 인용 처리가 아닌 전체 쉘 구문(이 경우 zsh 구문) 토큰화를 수행하는 것입니다. 예를 들어, 행은 예상한 것과는 다르게 a$(b c)<y>y<<<"a b"으로 표시됩니다 .fields=( 'a$(b c)' '<' y '>' y '<<<' 'a b' )fields=( 'a$(b' 'c)<y>y<<<a b' )

다차원 배열 및 데이터 (역)직렬화1를 지원하는 셸의 경우 ksh93을 참조하세요.

$ printf '%s\n' $'( (\'a b\' a) (\'b\\c\n\' d) )' | 
> ksh -c 'read -C a; typeset -p a; printf "<%s>\n" "${a[1][0]}"'
typeset -a a=(('a b' a) ($'b\\c\n' d) )
<b\c
>

내가 마지막으로 테스트했을 때(수년 전) 버그가 많았고 아마도 여전히 그럴 가능성이 높습니다. eval입력이 유효한 직렬화된 스트림이라는 보장이 없다면 .

오! 사실 아니다:

$ printf '%s\n' '( [`uname>&2`]=1 )' | ksh -c 'read -C a'
Linux

또한 JSON 문자열에는 NUL이 포함될 수 있지만 zsh 변수에만 NUL이 포함될 수 있습니다. 복잡한 데이터 구조를 처리하려면 쉘 대신 적절한 프로그래밍 언어를 사용하는 것이 더 합리적입니다.

^{1 기록에 따르면, AT&T는 개발 팀이 해체되기 전에 ksh93의 마지막 베타 버전을 출시했습니다. ksh2020(현재는 사용되지 않음)의 기반이 되는 ksh93도 JSON (역)직렬화에 대한 일부 실험적 지원을 제공했습니다. ksh2020에서 제거됨). 또한 CSV 입력/출력을 지원합니다.}

Question 2

read모든 추가 열을 지정된 성에 할당하면 모든 열이 line변수에 포함됩니다. ZSH에서:

% echo 'abc\ def ghi' | while read -r line; do print -Rl $line; done
abc\ def ghi
% echo 'abc\ def ghi' | while read -r line and; do print -Rl $line $and; done
abc\
def ghi
% echo 'abc\ def ghi' | while read -r line and another; do print -Rl $line $and $another; done
abc\
def
ghi

따라서 백슬래시와 리터럴 문자열을 처리하려면 실제로 보간( eval최악의 경우) 이 필요합니다 . ZSH에서는 "zsh 명령줄과 같은 단어 분할"이 매우 유사합니다.line\n(z)

% echo 'abc\ def ghi' | while read -r line; do cols=(${(z)line}); printf ">%s<\n" $cols[@]; done
>abc\ def<
>ghi<

echo이식성이 좋지도 않으며 가능한 경우 ZSH printf와 같은 쉘 관련 내장 기능으로 대체해야 합니다.print

% printf "abc\ def ghi\njkl" | while read -r line; do cols=(${(z)line}); printf ">%s<\n" $cols[@]; done
>abc\ def<
>ghi<

이런, jkl우리 어디 갔었어? 자동 데이터 손실은 재미가 없습니다.

% printf "abc\ def ghi\njkl\n" | while read -r line; do cols=(${(z)line}); printf ">%s<\n" $cols[@]; done
>abc\ def<
>ghi<
>jkl<

그게 다야... 하지만 여전히 \경우가 있는데, 역참조할 수 있을까요? 아직 ZSH에 있음:

% printf "abc\ def ghi\njkl\n" | while read -r line; do cols=(${(z)line}); print -l ${(Q)cols}; done
abc def
ghi
jkl

텍스트가 나타나면 printf줄 바꿈이 제공됩니다 .\n이러한 옵션을 삽입할 수도 있습니다., 더 많은 작업입니다. 대부분의 다른 셸에서는 evalZSH 작업을 수행하는 데 적합한 인수 플래그가 없을 수 있으므로 작업을 수행합니다 . 따라서 eval이 프로젝트에서 셸을 계속 사용하려면 아무것도 실행하지 않기를 바라면서 여기 저기 붙어 있거나 두 가지 다른 버전의 스크립트가 있는 것입니다. 어쩌면 (z)일부 테스트에서는 ZSH가 항상 입력 형식으로 원하는 작업을 수행할 것이라고 100% 확신하지 못할 수도 있습니다.

while(특히 그런 까다로운 것을 사용 하거나 스크립트가 약 20줄보다 긴 경우에는 쉘에서 전환하기 위한 임계값을 매우 낮게 설정합니다 .)

무작위 벤치마크

.에서 시작되는 265625줄 입력 파일의 경우 Perl은 ZSH보다 1282% 빠릅니다 /etc/passwd.

#!/usr/bin/env perl
#our @array; # I'll let the shell folks puzzle out multi-dimensional arrays
while (readline) {
    chomp;
    #push @array, [ map { s/\\ / /gr } split /(?<!\\) / ];
    print join(' ', map { s/\\ / /gr } split /(?<!\\) /), "\n";
}

#!/usr/bin/env zsh
# do you like silent data loss? if so, remove the || check
while IFS= read line || [ -n "$line" ]; do
  fields=( "${(Q@)${(z)line}}" )
  typeset -p fields
done

Answer

read모든 추가 열을 지정된 성에 할당하면 모든 열이 line변수에 포함됩니다. ZSH에서:

% echo 'abc\ def ghi' | while read -r line; do print -Rl $line; done
abc\ def ghi
% echo 'abc\ def ghi' | while read -r line and; do print -Rl $line $and; done
abc\
def ghi
% echo 'abc\ def ghi' | while read -r line and another; do print -Rl $line $and $another; done
abc\
def
ghi

따라서 백슬래시와 리터럴 문자열을 처리하려면 실제로 보간( eval최악의 경우) 이 필요합니다 . ZSH에서는 "zsh 명령줄과 같은 단어 분할"이 매우 유사합니다.line\n(z)

% echo 'abc\ def ghi' | while read -r line; do cols=(${(z)line}); printf ">%s<\n" $cols[@]; done
>abc\ def<
>ghi<

echo이식성이 좋지도 않으며 가능한 경우 ZSH printf와 같은 쉘 관련 내장 기능으로 대체해야 합니다.print

% printf "abc\ def ghi\njkl" | while read -r line; do cols=(${(z)line}); printf ">%s<\n" $cols[@]; done
>abc\ def<
>ghi<

이런, jkl우리 어디 갔었어? 자동 데이터 손실은 재미가 없습니다.

% printf "abc\ def ghi\njkl\n" | while read -r line; do cols=(${(z)line}); printf ">%s<\n" $cols[@]; done
>abc\ def<
>ghi<
>jkl<

그게 다야... 하지만 여전히 \경우가 있는데, 역참조할 수 있을까요? 아직 ZSH에 있음:

% printf "abc\ def ghi\njkl\n" | while read -r line; do cols=(${(z)line}); print -l ${(Q)cols}; done
abc def
ghi
jkl

텍스트가 나타나면 printf줄 바꿈이 제공됩니다 .\n이러한 옵션을 삽입할 수도 있습니다., 더 많은 작업입니다. 대부분의 다른 셸에서는 evalZSH 작업을 수행하는 데 적합한 인수 플래그가 없을 수 있으므로 작업을 수행합니다 . 따라서 eval이 프로젝트에서 셸을 계속 사용하려면 아무것도 실행하지 않기를 바라면서 여기 저기 붙어 있거나 두 가지 다른 버전의 스크립트가 있는 것입니다. 어쩌면 (z)일부 테스트에서는 ZSH가 항상 입력 형식으로 원하는 작업을 수행할 것이라고 100% 확신하지 못할 수도 있습니다.

while(특히 그런 까다로운 것을 사용 하거나 스크립트가 약 20줄보다 긴 경우에는 쉘에서 전환하기 위한 임계값을 매우 낮게 설정합니다 .)

무작위 벤치마크

.에서 시작되는 265625줄 입력 파일의 경우 Perl은 ZSH보다 1282% 빠릅니다 /etc/passwd.

#!/usr/bin/env perl
#our @array; # I'll let the shell folks puzzle out multi-dimensional arrays
while (readline) {
    chomp;
    #push @array, [ map { s/\\ / /gr } split /(?<!\\) / ];
    print join(' ', map { s/\\ / /gr } split /(?<!\\) /), "\n";
}

#!/usr/bin/env zsh
# do you like silent data loss? if so, remove the || check
while IFS= read line || [ -n "$line" ]; do
  fields=( "${(Q@)${(z)line}}" )
  typeset -p fields
done

Question 3

공교롭게도 분할(따옴표 없는 변수 확장)이나 읽기를 처리할 때 쉘은 매우 얕을 수 있습니다.

코드가 다음과 같을 때 이 문제가 발생합니다.argshow $line 실행

배시 사용:

$ set -- 1 2 3 4
$ echo ${@@A}
set -- '1' '2' '3' '4'

$ var='1 2 3 4'
$ set -- $var
$ echo ${@@A}
set -- '1' '2' '3' '4'         # that seems to work.

$ var='1 2\ 3 4'; set -- $var
$ echo ${@@A}
set -- '1' '2\' '3' '4'        # oops, why is that `\` ignored ?

변수에서 확장할 때 특별한 구문을 \제공하는 규칙이 없기 때문에 무시됩니다 .\

\예, 명령줄을 구문 분석할 때 (여전히) 특별한 규칙이 있습니다.

$ set -- 1 2\ 3 4
$ echo ${@@A}
set -- '1' '2 3' '4'

그러나 이것은 변수 확장에서는 작동하지 않습니다.

$'...'읽으려면 별도의 줄이 필요하지만 printf 또는 ANSI-C 이스케이프 형식을 사용하여 수행할 수 있습니다.

$ printf '%s]n' a b c d
a
b
c
d

$ i=1; printf '%s\n' a b c d | while read -r line; do printf '%s %s \n' $((i++)) $line; done
1 a 
2 b 
3 c 
4 d 

$ var='a b c d'
$ i=1; printf '%s\n' $var | while read -r line; do printf '%s %s \n' $((i++)) $line; done
1 a
2 b
3 c
4 d           # it seems to work.

$ var='a b\ c d'
$ i=1; printf '%s\n' $var | while read -r line; do printf '%s %s \n' $((i++)) $line; done
1 a 
2 b\
3 c
4 d

그래서 "참조변수 확장"에 대한 글이 많이 올라오고 있습니다. 배열 작업은 문자열 작업과 다릅니다.

$ var=( a b\ c d)
$ printf '%s\n' "${var[@]}"
a
b c
d

# Or even
$ set -- "${var[@]}"
$ printf '%s\n' "$@"
a
b c
d

즉, 변수 확장은 다음과 같이 분할됩니다.오직IFS 구분 기호. 일반적으로 한 가지 유형의 구분 기호(공백)로 축소됩니다.

$ ( IFS=''; var='a b\ c d'; printf '<%s> ' $var; echo )
<a b\ c d> 

$ ( IFS=' '; var='a b\ c d'; printf '<%s> ' $var; echo )
<a> <b\> <c> <d>

\여기에는 명령줄에 사용된 인용 공백( )의 영향이 포함되지 않습니다 .

쉘은 zsh훨씬 더 얕아서 (필요하지 않은 경우) 변수 확장을 전혀 분할하지 않습니다.

% var='a b\ c d'
% printf '<%s>\n' $var
<a b\ c d>

% printf '<%s>\n' $=var
a
b\
c
d

그러나 \문제는 여전히 동일합니다.

Answer

공교롭게도 분할(따옴표 없는 변수 확장)이나 읽기를 처리할 때 쉘은 매우 얕을 수 있습니다.

코드가 다음과 같을 때 이 문제가 발생합니다.argshow $line 실행

배시 사용:

$ set -- 1 2 3 4
$ echo ${@@A}
set -- '1' '2' '3' '4'

$ var='1 2 3 4'
$ set -- $var
$ echo ${@@A}
set -- '1' '2' '3' '4'         # that seems to work.

$ var='1 2\ 3 4'; set -- $var
$ echo ${@@A}
set -- '1' '2\' '3' '4'        # oops, why is that `\` ignored ?

변수에서 확장할 때 특별한 구문을 \제공하는 규칙이 없기 때문에 무시됩니다 .\

\예, 명령줄을 구문 분석할 때 (여전히) 특별한 규칙이 있습니다.

$ set -- 1 2\ 3 4
$ echo ${@@A}
set -- '1' '2 3' '4'

그러나 이것은 변수 확장에서는 작동하지 않습니다.

$'...'읽으려면 별도의 줄이 필요하지만 printf 또는 ANSI-C 이스케이프 형식을 사용하여 수행할 수 있습니다.

$ printf '%s]n' a b c d
a
b
c
d

$ i=1; printf '%s\n' a b c d | while read -r line; do printf '%s %s \n' $((i++)) $line; done
1 a 
2 b 
3 c 
4 d 

$ var='a b c d'
$ i=1; printf '%s\n' $var | while read -r line; do printf '%s %s \n' $((i++)) $line; done
1 a
2 b
3 c
4 d           # it seems to work.

$ var='a b\ c d'
$ i=1; printf '%s\n' $var | while read -r line; do printf '%s %s \n' $((i++)) $line; done
1 a 
2 b\
3 c
4 d

그래서 "참조변수 확장"에 대한 글이 많이 올라오고 있습니다. 배열 작업은 문자열 작업과 다릅니다.

$ var=( a b\ c d)
$ printf '%s\n' "${var[@]}"
a
b c
d

# Or even
$ set -- "${var[@]}"
$ printf '%s\n' "$@"
a
b c
d

즉, 변수 확장은 다음과 같이 분할됩니다.오직IFS 구분 기호. 일반적으로 한 가지 유형의 구분 기호(공백)로 축소됩니다.

$ ( IFS=''; var='a b\ c d'; printf '<%s> ' $var; echo )
<a b\ c d> 

$ ( IFS=' '; var='a b\ c d'; printf '<%s> ' $var; echo )
<a> <b\> <c> <d>

\여기에는 명령줄에 사용된 인용 공백( )의 영향이 포함되지 않습니다 .

쉘은 zsh훨씬 더 얕아서 (필요하지 않은 경우) 변수 확장을 전혀 분할하지 않습니다.

% var='a b\ c d'
% printf '<%s>\n' $var
<a b\ c d>

% printf '<%s>\n' $=var
a
b\
c
d

그러나 \문제는 여전히 동일합니다.

무작위 벤치마크

답변1

답변2

무작위 벤치마크

답변3

관련 정보