설명하다:

Question 1

다음은 논리적 AND 연산을 사용하여 패턴 파일의 한 줄당 두 패턴(공백으로 구분)에 대한 순수한 awk 솔루션입니다.

awk 'NR==FNR{patts[$1]=$2;next}{for (i in patts) if (($0 ~ i) && ($0 ~ patts[i])) print}' patterns file

고쳐 쓰다:
정규식 일치가 아닌 단어의 경우 다음 대안을 평가할 수 있습니다.

awk 'NR==FNR{patts[$0]="\\<" $1 "\\>.*\\<" $2 "\\>|\\<" $2 "\\>.*\\<" $1 "\\>";next} \
{for (i in patts) if ($0 ~ patts[i]) print}' patterns file1

실제로 패턴을 변환하여 단어 일치를 833 7777수행
\<833\>.*\<7777\> | \<7777\>.*\<833\>하고 두 패턴의 논리적 AND를 시뮬레이션합니다.

이 솔루션은 테스트되었으며 다음 기록과 일치하지 않습니다.G 77771 2833

업데이트 2번
이렇게 하면 구분 기호 문자열을 사용하여 단어 일치, 논리적 AND 및 일치하는 각 그룹의 인쇄가 보장됩니다.

awk 'NR==FNR{patts[$0]="\\<" $1 "\\>.*\\<" $2 "\\>|\\<" $2 "\\>.*\\<" $1 "\\>";next} \
{for (i in patts) {if ($0 ~ patts[i]) !found[i]?found[i]=$0:found[i]=found[i] ORS $0}} \
END{for (k in found) {print found[k];print "-----"}}' patterns file1

#Output
A 833 0 0 0 0 7777 0 0 0 0
F 7777 833
-----
D illicit Jam fox 33333
-----                  
C the cow jumps over the 311 moon 2222
-----

여기서 온라인 테스트를 해보세요.

추신: awk가 연관 배열을 처리하는 방식으로 인해 END 섹션에 있는 배열의 인쇄에 영향을 미칠 수 없습니다. 어떤 면에서는 "무작위"일 것입니다.

Answer

다음은 논리적 AND 연산을 사용하여 패턴 파일의 한 줄당 두 패턴(공백으로 구분)에 대한 순수한 awk 솔루션입니다.

awk 'NR==FNR{patts[$1]=$2;next}{for (i in patts) if (($0 ~ i) && ($0 ~ patts[i])) print}' patterns file

고쳐 쓰다:
정규식 일치가 아닌 단어의 경우 다음 대안을 평가할 수 있습니다.

awk 'NR==FNR{patts[$0]="\\<" $1 "\\>.*\\<" $2 "\\>|\\<" $2 "\\>.*\\<" $1 "\\>";next} \
{for (i in patts) if ($0 ~ patts[i]) print}' patterns file1

실제로 패턴을 변환하여 단어 일치를 833 7777수행
\<833\>.*\<7777\> | \<7777\>.*\<833\>하고 두 패턴의 논리적 AND를 시뮬레이션합니다.

이 솔루션은 테스트되었으며 다음 기록과 일치하지 않습니다.G 77771 2833

업데이트 2번
이렇게 하면 구분 기호 문자열을 사용하여 단어 일치, 논리적 AND 및 일치하는 각 그룹의 인쇄가 보장됩니다.

awk 'NR==FNR{patts[$0]="\\<" $1 "\\>.*\\<" $2 "\\>|\\<" $2 "\\>.*\\<" $1 "\\>";next} \
{for (i in patts) {if ($0 ~ patts[i]) !found[i]?found[i]=$0:found[i]=found[i] ORS $0}} \
END{for (k in found) {print found[k];print "-----"}}' patterns file1

#Output
A 833 0 0 0 0 7777 0 0 0 0
F 7777 833
-----
D illicit Jam fox 33333
-----                  
C the cow jumps over the 311 moon 2222
-----

여기서 온라인 테스트를 해보세요.

추신: awk가 연관 배열을 처리하는 방식으로 인해 END 섹션에 있는 배열의 인쇄에 영향을 미칠 수 없습니다. 어떤 면에서는 "무작위"일 것입니다.

Question 2

file1의 각 줄에 정확히 두 개의 문자열이 포함되어 있는 것으로 알려진 경우:

while read -ra elements; do
   grep "${elements[0]}" file2 | \
     grep "${elements[1]}" && \
     echo "----"
done < file1

Answer

file1의 각 줄에 정확히 두 개의 문자열이 포함되어 있는 것으로 알려진 경우:

while read -ra elements; do
   grep "${elements[0]}" file2 | \
     grep "${elements[1]}" && \
     echo "----"
done < file1

Question 3

perl더 명확해 보인다고 생각해서 이렇게 하겠습니다 .

#!/usr/#bin/env perl
use strict;
use warnings;
use Data::Dumper;


my ( $pattern_file_name, $process_file_name ) = @ARGV; 

open ( my $patterns_file, '<', $pattern_file_name ) or die $!;
my @matches = map { [split] } <$patterns_file>;
close ( $patterns_file );

print "Using:\n";
print Dumper \@matches;

#my @matches = ( [ '311', '2222' ], [ '833', '7777' ], [ 'Jam', '33333' ] );

#read main file
my @results;
open  ( my $input, '<', $process_file_name ) or die $!; 

#iterate a line at a time. 
while ( my $line = <$input> ) {
 GROUP:
   for my $id ( 0 .. $#matches ) {
      #Check each set of expressions.
      foreach my $expression ( @{ $matches[$id] } ) { 
         #move to the next group if any don't match
         next GROUP unless $line =~ m/$expression/;
      }
      #didn't get skipped, so must have matched all. 
      push( @{ $results[$id] }, $line );
   }
}
print Dumper \@results;

print "\n$_\n" for @results;
close ( $input );

Answer

perl더 명확해 보인다고 생각해서 이렇게 하겠습니다 .

#!/usr/#bin/env perl
use strict;
use warnings;
use Data::Dumper;


my ( $pattern_file_name, $process_file_name ) = @ARGV; 

open ( my $patterns_file, '<', $pattern_file_name ) or die $!;
my @matches = map { [split] } <$patterns_file>;
close ( $patterns_file );

print "Using:\n";
print Dumper \@matches;

#my @matches = ( [ '311', '2222' ], [ '833', '7777' ], [ 'Jam', '33333' ] );

#read main file
my @results;
open  ( my $input, '<', $process_file_name ) or die $!; 

#iterate a line at a time. 
while ( my $line = <$input> ) {
 GROUP:
   for my $id ( 0 .. $#matches ) {
      #Check each set of expressions.
      foreach my $expression ( @{ $matches[$id] } ) { 
         #move to the next group if any don't match
         next GROUP unless $line =~ m/$expression/;
      }
      #didn't get skipped, so must have matched all. 
      push( @{ $results[$id] }, $line );
   }
}
print Dumper \@results;

print "\n$_\n" for @results;
close ( $input );

Question 4

perl -wMstrict -Mvars='*f2' -l -0777ane '
   if ( ! @ARGV ) {# this is File1 zone: slurped in $_
      while ( /^(\S+)\s+(\S+)$/mg ) {
         my $rx = qr/^(?=.*$1)(?=.*$2)/m; # AND matching of $1/$2
         pos($f2)=0;
         $f2 =~ /\G([^\n]+)/m and print $1 while $f2 =~ /$rx/mg;
         print "--- <Separator> ---" unless /\G\n\z/;
      }
   } else {# This is File2 zone: slurped whole in $f2
      $f2 = $_;
   }
' File2 File1 #<----- order is important here

설명하다:

여기서는 인쇄 순서가 매우 중요하다는 점을 기억해야 합니다. File2의 행은 File1의 문자열에 의해 결정된 순서대로 인쇄됩니다. File1의 각 행이 File1과 패턴 일치된 후에는 일치 성공 여부에 관계없이 별도의 행도 필요합니다. 파일이 빨려지고 File2 => $f2이며 파일은 $_로 처리됩니다.

Answer

perl -wMstrict -Mvars='*f2' -l -0777ane '
   if ( ! @ARGV ) {# this is File1 zone: slurped in $_
      while ( /^(\S+)\s+(\S+)$/mg ) {
         my $rx = qr/^(?=.*$1)(?=.*$2)/m; # AND matching of $1/$2
         pos($f2)=0;
         $f2 =~ /\G([^\n]+)/m and print $1 while $f2 =~ /$rx/mg;
         print "--- <Separator> ---" unless /\G\n\z/;
      }
   } else {# This is File2 zone: slurped whole in $f2
      $f2 = $_;
   }
' File2 File1 #<----- order is important here

설명하다:

여기서는 인쇄 순서가 매우 중요하다는 점을 기억해야 합니다. File2의 행은 File1의 문자열에 의해 결정된 순서대로 인쇄됩니다. File1의 각 행이 File1과 패턴 일치된 후에는 일치 성공 여부에 관계없이 별도의 행도 필요합니다. 파일이 빨려지고 File2 => $f2이며 파일은 $_로 처리됩니다.

설명하다:

답변1

답변2

답변3

답변4

설명하다:

관련 정보