한 파일에서 다른 파일의 패턴 발생 횟수를 계산하는 우아한 방법

Question 1

다음과 같은 간단한 것:

mapfile -t names < file1
for name in "${names[@]}"
do
  echo "${name}" $(grep -c "^$name " file2)
done

다음 출력을 제공합니다.

Peht 2
Mawo 3
Stso 1
Makr 0
Bavo 2

grep string은 줄의 시작 부분(^)에 사용자 이름을 고정하고 줄 뒤에 공백을 강제 적용하는 것을 의미합니다.

Answer

다음과 같은 간단한 것:

mapfile -t names < file1
for name in "${names[@]}"
do
  echo "${name}" $(grep -c "^$name " file2)
done

다음 출력을 제공합니다.

Peht 2
Mawo 3
Stso 1
Makr 0
Bavo 2

grep string은 줄의 시작 부분(^)에 사용자 이름을 고정하고 줄 뒤에 공백을 강제 적용하는 것을 의미합니다.

Question 2

테스트.awk:

FNR == NR{ 
  names[$1]
  next
}   
($1 in names){
  ulog[$1]++
}   
END{
  for(name in ulog){
    print name ":" ulog[name]
  }   
}

다음과 같이 실행하십시오. awk -f test.awk user.list user.log

FNR==NR # 파일 레코드 번호 == 레코드 번호, 그렇다면 여전히 첫 번째 파일에 있습니다.

next # 아직 첫 번째 파일에 있으므로 나머지는 건너뛰고 다음 줄을 가져옵니다.

나머지는 자명해야합니다.

아니면 한 줄로

awk 'FNR == NR{ names[$1]; next } ($1 in names){ ulog[$1]++ } END{ for(name in ulog){ print name ":" ulog[name] } }' user.list user.log

Answer

테스트.awk:

FNR == NR{ 
  names[$1]
  next
}   
($1 in names){
  ulog[$1]++
}   
END{
  for(name in ulog){
    print name ":" ulog[name]
  }   
}

다음과 같이 실행하십시오. awk -f test.awk user.list user.log

FNR==NR # 파일 레코드 번호 == 레코드 번호, 그렇다면 여전히 첫 번째 파일에 있습니다.

next # 아직 첫 번째 파일에 있으므로 나머지는 건너뛰고 다음 줄을 가져옵니다.

나머지는 자명해야합니다.

아니면 한 줄로

awk 'FNR == NR{ names[$1]; next } ($1 in names){ ulog[$1]++ } END{ for(name in ulog){ print name ":" ulog[name] } }' user.list user.log

Question 3

//를 join수행 하는 또 다른 방법은 다음과 같습니다 .sortuniq

join  -1 1 -2 2 -a1 -e "0" -o 1.1 2.1 <(sort file1) \
<(cut -d' ' -f1 file2 | sort | uniq -c)

기본적으로 이름을 UE 이름 file1과 uniq연결하고 file2사용 0중인 누락된 필드를 기준으로 계산합니다 file2.

나는 awk다음을 실행할 것이다:

awk 'NR==FNR{s[$1]++;next}
{if ($1 in s) {print $1, s[$1]}
else {print $1, 0}}' file2 file1

먼저 read 를 실행하고 file2, 각 이름의 발생 횟수를 세고, 그런 다음 file1각 이름의 개수를 읽고 인쇄합니다 file2(또는 file2이름이 해당 이름에 없으면 0을 인쇄합니다).

Answer

//를 join수행 하는 또 다른 방법은 다음과 같습니다 .sortuniq

join  -1 1 -2 2 -a1 -e "0" -o 1.1 2.1 <(sort file1) \
<(cut -d' ' -f1 file2 | sort | uniq -c)

기본적으로 이름을 UE 이름 file1과 uniq연결하고 file2사용 0중인 누락된 필드를 기준으로 계산합니다 file2.

나는 awk다음을 실행할 것이다:

awk 'NR==FNR{s[$1]++;next}
{if ($1 in s) {print $1, s[$1]}
else {print $1, 0}}' file2 file1

먼저 read 를 실행하고 file2, 각 이름의 발생 횟수를 세고, 그런 다음 file1각 이름의 개수를 읽고 인쇄합니다 file2(또는 file2이름이 해당 이름에 없으면 0을 인쇄합니다).

관련 정보