표현식과 일치하지 않는 것 같은 grep 출력 라인이 왜 발생합니까?
에서 언급했듯이내 댓글이 동작은 버그로 인해 발생할 수 있습니다.
다른 로케일이 문자 순서에 영향을 미칠 수 있다는 것을 알고 있지만 아래의 -o 출력을 통해 이것이 문제가 아니라는 것을 확인했다고 생각했지만 제가 틀렸습니다. LC_ALL=C를 추가하면 예상되는 출력이 제공됩니다.
나는 가지고있다이 문제로케일이 출력에 영향을 미치는 것을 본 후.
[aa@bb grep-test]$ cat input.txt
aa bb
CC cc
dd ee
[aa@bb grep-test]$ LC_ALL=C grep -o [A-Z] input.txt
[aa@bb grep-test]$ grep -o [A-Z] input.txt
[aa@bb grep-test]$ LC_ALL=C grep [A-Z] input.txt
CC cc
[aa@bb grep-test]$ grep [A-Z] input.txt
aa bb
CC cc
dd ee
[aa@bb grep-test]$
[aa@bb tmp]$ cat test
aa bb
CC cc
dd ee
[aa@bb tmp]$ grep [A-Z] test
aa bb
CC cc
dd ee
[aa@bb tmp]$ grep -o [A-Z] test
[aa@bb tmp]$ grep -E [A-Z] test
aa bb
CC cc
dd ee
[aa@bb tmp]$ grep -n [A-Z] test
1:aa bb
2:CC cc
3:dd ee
[aa@bb tmp]$ echo [A-Z]
[aa@bb tmp]$ grep -V
GNU grep 2.6.3
[aa@bb tmp]$ bash --version
GNU bash, version 4.1.2(1)-release (x86_64-redhat-linux-gnu)
[aa@bb grep-test]$ command -v grep
[aa@bb grep-test]$ rpm -q -f $(command -v grep)
[aa@bb grep-test]$ echo grep [A-Z] input.txt | xxd
0000000: 6772 6570 205b 412d 5a5d 2069 6e70 7574 grep [A-Z] input
0000010: 2e74 7874 0a .txt.
[aa@bb grep-test]$ cmd='grep [A-Z] input.txt'; echo $cmd | xxd; eval $cmd
0000000: 6772 6570 205b 412d 5a5d 2069 6e70 7574 grep [A-Z] input
0000010: 2e74 7874 0a .txt.
aa bb
CC cc
dd ee
[aa@bb grep-test]$ xxd input.txt
0000000: 6161 2062 620a 4343 2063 630a 6464 2065 aa bb.CC cc.dd e
0000010: 650a 0a e..
[aa@bb grep-test]$
귀하의 "A"는 라틴어 "A"가 아닙니다.
cmd='grep [A-Z] test'; echo $cmd | xxd; eval $cmd
0000000: 6772 6570 205b ***41***2d 5a5d 2074 6573 740a grep [A-Z] test.
CC cc
cmd='grep [А-Z] test'; echo $cmd | xxd; eval $cmd
0000000: 6772 6570 205b ***d090*** 2d5a 5d20 7465 7374 grep [..-Z] test
0000010: 0a .
aa bb
CC cc
dd ee
귀하의 로케일 대조가 매우 도움이 되는 것 같습니다.
시도 해봐
LC_ALL=C grep [A-Z] input.txt
이 아이디어를 테스트하기 위해.
나는 가지고있다
export LANG=en_US.UTF-8
유니코드 이점을 계속 얻으면서 이러한 번거로움을 피하기 위해 쉘을 실행합니다.
BSD 또는 GNU를 사용하여 복사할 수 없습니다 grep
$ cat test
aa bb
CC cc
dd ee
$ grep [A-Z] test
CC cc
$ grep --version
grep (BSD grep) 2.5.1-FreeBSD
암소 비슷한 일종의 영양:
$ cat test
aa bb
CC cc
dd ee
$ grep [A-Z] test
CC cc
$ grep --version
grep (GNU grep) 2.25
Copyright (C) 2016 Free Software Foundation, Inc.
License GPLv3+: GNU GPL version 3 or later <http://gnu.org/licenses/gpl.html>.
This is free software: you are free to change and redistribute it.
There is NO WARRANTY, to the extent permitted by law.
Written by Mike Haertel and others, see <http://git.sv.gnu.org/cgit/grep.git/tree/AUTHORS>.