BASH: 문서의 각 줄에 있는 단어 수 계산

Question 1

file2의 간단한 형식과 공백으로 구분된 단어의 경우 다음을 시도해 보세요.

$ awk '{print NF}' file2
4
4
4

awk에서는 NF필드 수입니다. 기본적으로 awk에서는 단어 문자가 공백으로 구분됩니다.

:file1의 경우 단어는 콜론이나 공백으로 구분할 수 있으므로 필드 구분 기호에 다음을 추가해야 합니다 .

$ awk -F'[: \t]+' '{print NF}' file1
5
5
5

개선하다

행에 선행 또는 후행 공백이 있으면 awk는 추가 필드가 있다고 가정합니다. file1과 마찬가지로 필드를 계산하기 전에 이러한 공백을 제거하여 이 문제를 해결할 수 있습니다.

awk -F'[: \t]+' '{gsub(/^[: \t]+|[: \t]+$/, ""); print NF}' file1

또는 file2는 다음과 같습니다.

awk '{gsub(/^[[:space:]]+|[[:space:]]+$/, ""); print NF}' file2

정규식에서는 ^[[:space:]]+선행 공백 및 [[:space:]]+$후행 공백과 일치합니다. 명령에서 해당 조합을 사용하면 gsub둘 다 제거됩니다.

일반화하다

필드 구분 기호가 - |: 또는 중 하나일 수 있는 경우 다음을 사용하십시오.

awk -F'[-|: \t]+' '{gsub(/^[[-\|: \t]+|[[-\|: \t]+$/, ""); print NF}'

예:

$ cat file3
| [email protected] | er34532 |  
| [email protected] | 764474 |
$ awk -F'[-|: \t]+' '{gsub(/^[[-\|: \t]+|[[-\|: \t]+$/, ""); print NF}' file3
2
2

Answer

file2의 간단한 형식과 공백으로 구분된 단어의 경우 다음을 시도해 보세요.

$ awk '{print NF}' file2
4
4
4

awk에서는 NF필드 수입니다. 기본적으로 awk에서는 단어 문자가 공백으로 구분됩니다.

:file1의 경우 단어는 콜론이나 공백으로 구분할 수 있으므로 필드 구분 기호에 다음을 추가해야 합니다 .

$ awk -F'[: \t]+' '{print NF}' file1
5
5
5

개선하다

행에 선행 또는 후행 공백이 있으면 awk는 추가 필드가 있다고 가정합니다. file1과 마찬가지로 필드를 계산하기 전에 이러한 공백을 제거하여 이 문제를 해결할 수 있습니다.

awk -F'[: \t]+' '{gsub(/^[: \t]+|[: \t]+$/, ""); print NF}' file1

또는 file2는 다음과 같습니다.

awk '{gsub(/^[[:space:]]+|[[:space:]]+$/, ""); print NF}' file2

정규식에서는 ^[[:space:]]+선행 공백 및 [[:space:]]+$후행 공백과 일치합니다. 명령에서 해당 조합을 사용하면 gsub둘 다 제거됩니다.

일반화하다

필드 구분 기호가 - |: 또는 중 하나일 수 있는 경우 다음을 사용하십시오.

awk -F'[-|: \t]+' '{gsub(/^[[-\|: \t]+|[[-\|: \t]+$/, ""); print NF}'

예:

$ cat file3
| [email protected] | er34532 |  
| [email protected] | 764474 |
$ awk -F'[-|: \t]+' '{gsub(/^[[-\|: \t]+|[[-\|: \t]+$/, ""); print NF}' file3
2
2

Question 2

당신이 사용할 수있는이 트릭선택한 단어 정규식과 일치하는 Perl의 하위 문자열을 계산합니다. 예를 들어 \wPerl의 문자 집합으로 구성된 "단어" 시퀀스를 계산하고 @및.

perl -lne 'print my $count = () = $_ =~ /[\w@.]+/g' somefile

이것은 만든다

$ perl -lne 'print my $count = () = $_ =~ /[\w@.]+/g' file1
5
5
5

그리고

$ perl -lne 'print my $count = () = $_ =~ /[\w@.]+/g' file2
4
4
4

샘플 파일용.

Answer

당신이 사용할 수있는이 트릭선택한 단어 정규식과 일치하는 Perl의 하위 문자열을 계산합니다. 예를 들어 \wPerl의 문자 집합으로 구성된 "단어" 시퀀스를 계산하고 @및.

perl -lne 'print my $count = () = $_ =~ /[\w@.]+/g' somefile

이것은 만든다

$ perl -lne 'print my $count = () = $_ =~ /[\w@.]+/g' file1
5
5
5

그리고

$ perl -lne 'print my $count = () = $_ =~ /[\w@.]+/g' file2
4
4
4

샘플 파일용.

BASH: 문서의 각 줄에 있는 단어 수 계산

답변1

개선하다

일반화하다

답변2

관련 정보