Bash: y열의 값을 기준으로 x열의 값이 나타나는 횟수 계산

Bash: y열의 값을 기준으로 x열의 값이 나타나는 횟수 계산

이런 문자열이 있습니다.

data = "state:: 4 caller_contact:: sip:[email protected]:5080;transport=udp

state:: 4 caller_contact:: sip:[email protected]:5080;transport=udp

state:: 4 caller_contact:: sip:[email protected]:5080;transport=udp 

state:: 4 caller_contact:: sip:[email protected]:5080;transport=udp

state:: 2 caller_contact:: sip:[email protected]:5080;transport=udp 

state:: 2 caller_contact:: sip:[email protected]:5080;transport=udp 

state:: 1 caller_contact:: sip:[email protected]:5080;transport=udp"

각 IP(예: 192.168.26)에 상태 4 또는 상태 2가 있는 횟수를 계산하려면 bash 스크립트를 작성해야 합니다. (문자열에 "/n"이 포함되지 않음)

문자열을 파싱하여 각 IP를 기준으로 값을 계산할 수 없습니다.

답변1

가능한 모든 조합에 이것이 작동하는지 확실하지 않지만 제공한 작은 샘플에서는 작동합니다.

sed  "1,\$s/state/\nstate/g" file | grep state > NewFile
for IPADDR in $(cat NewFile | cut -d"@" -f2|cut -d":" -f1|sort -n|uniq);do
  for STATE in 2 4 ;do
    LineCount=$(grep "${IPADDR}" NewFile |grep "state:: ${STATE}"| wc -l)
    echo "For IP address ${IPADDR}, status:: ${STATE} lines count is ${LineCount}"
  done
done | grep -v "is 0"$

for 루프에 원하는 만큼 다양한 STATE 번호를 추가할 수 있습니다.

기본적으로 문자열이 나타날 때마다 개행 문자를 삽입하여 state큰 데이터 블록을 형성하고 여러 줄로 분할합니다.

답변2

고유한 IP를 찾고 각 상태를 4 또는 2로 계산합니다.

for addr in $(grep -o '@[^:]\+' file | sort -u); do 
    echo -n ${addr#@}:\ 
    grep -c ":: [24].*${addr#@}" file
done

또는 awk를 사용하여 작업을 수행하세요.

awk -F '[: @;=]+' '
    $2 ~ /^[24]$/{
        count[$6]++
        }
    END {
        for(i in count)
            print(i, count[i])
        }
    ' file

답변3

이건 나의 작은 괴물이에요.

#!/bin/bash 
# monsterr.sh

if [ -z "$1" ] ; then
    printf "%s\n" "Syntax error."
    exit 2
fi

data="$1"

tmp=tmp$$
mkdir $tmp

parse() {
    state=
    ip=
    i=0
    while read l; do
        ((i++))
        if [ $(($i%2)) -eq 0 ]; then
            if [ $(($i%4)) -eq 2 ]; then
                state=$l
            else
                IFS=: read x ip x < <(printf %s $l)
                IFS=@ read x ip < <(printf %s $ip)
                printf "%s\n" $state >> "$tmp/$ip"
            fi
        fi
    done <  <(printf "%s\n" $data)
}


report() {
    cd $tmp
    for f in * ; do
        declare -a count
        printf "IP: %s\n" $f
             while read s ; do
                ((count[$s]++))
            done < $f
        for s in ${!count[@]}; do
            printf "State: %s, count: %s\n" $s ${count[$s]}
        done
        printf '\n'
        unset count
    done
    cd - 2 > /dev/null
}

parse
report

rm -r $tmp

용법:

$ data="state:: 4 caller_contact:: sip:[email protected]:5080;transport=udp state:: 4 caller_contact:: sip:[email protected]:5080;transport=udp state:: 4 caller_contact:: sip:[email protected]:5080;transport=udp state:: 4 caller_contact:: sip:[email protected]:5080;transport=udp state:: 2 caller_contact:: sip:[email protected]:5080;transport=udp  state:: 2 caller_contact:: sip:[email protected]:5080;transport=udp state:: 1 caller_contact:: sip:[email protected]:5080;transport=udp"
$ ./monsterr.sh "$data"
IP: 192.168.10.01
State: 4, count: 1

IP: 192.168.10.03
State: 4, count: 1

IP: 192.168.10.07
State: 1, count: 1

IP: 192.168.10.11
State: 2, count: 1
State: 4, count: 1

IP: 192.168.10.26
State: 2, count: 1
State: 4, count: 1

답변4

grep처리하려는 행에 대해 sed.Use sed, sort 및 count 를 사용하여 행에서 2개의 하위 문자열을 가져올 수 있습니다.

sed -n '/state:: [24] .*@/ s/.*:: \([24]\)[^@]*@\([^:]*\).*/State \1 IP \2/p' file |
 sort | uniq -c | sort -n

관련 정보