동일한 파일에 여러 번 나타나는 두 문자열 사이의 데이터 수를 얻는 방법

Question 1

새롭고 더 나은 문제 설명을 고려하면 실제로 더 쉽습니다.

#!/bin/bash
awk 'BEGIN {
            SETNR=0; 
            MODE="Non-Fields"}
(MODE=="Fields") && (! /START-OF-/ ) && (! /END-OF/ ) {
            print; 
            COUNT++
           }
/START-OF-FIELDS/ {
            COUNT=0; 
            SETNR++; 
            MODE="Fields"
           }
/END-OF/ {
            if (MODE=="Fields") {
                 printf ("Count for data set %d is: %d\n", SETNR, COUNT)
                };
            MODE="Non-Fields"
         }' $*

Answer

새롭고 더 나은 문제 설명을 고려하면 실제로 더 쉽습니다.

#!/bin/bash
awk 'BEGIN {
            SETNR=0; 
            MODE="Non-Fields"}
(MODE=="Fields") && (! /START-OF-/ ) && (! /END-OF/ ) {
            print; 
            COUNT++
           }
/START-OF-FIELDS/ {
            COUNT=0; 
            SETNR++; 
            MODE="Fields"
           }
/END-OF/ {
            if (MODE=="Fields") {
                 printf ("Count for data set %d is: %d\n", SETNR, COUNT)
                };
            MODE="Non-Fields"
         }' $*

Question 2

해결책 awk:

$ awk '/END-OF/{flag=0;printf "Count for data set %d is: %d\n",++i,count;count=0;printf "\n"}
    {if(flag){
         count++;
         print;
     }}
    /START-OF/{flag=1}' file
ID
NAME
DEPT
Count for data set 1 is: 3

1|joy|cs
2|sam|ec
Count for data set 2 is: 2

ID 
NAME
DOB
DEPT
ADDRESS
Count for data set 3 is: 5

5|joe|13/2/2001/|ee|street1
3|gwen|4/08/1999|cs|street2
Count for data set 4 is: 2

Answer

해결책 awk:

$ awk '/END-OF/{flag=0;printf "Count for data set %d is: %d\n",++i,count;count=0;printf "\n"}
    {if(flag){
         count++;
         print;
     }}
    /START-OF/{flag=1}' file
ID
NAME
DEPT
Count for data set 1 is: 3

1|joy|cs
2|sam|ec
Count for data set 2 is: 2

ID 
NAME
DOB
DEPT
ADDRESS
Count for data set 3 is: 5

5|joe|13/2/2001/|ee|street1
3|gwen|4/08/1999|cs|street2
Count for data set 4 is: 2

Question 3

귀하의 문제는 더 잘 정의되어야 하지만 귀하의 예제 입력을 보면 귀하가 원하는 것이 무엇인지 추측하고 있습니다. 다음과 같은 작은 AWK 스크립트를 사용하십시오.

#!/bin/bash

awk '! /START-OF-/ {
  if (MODE=="DEFINE") { HEADER=HEADER $0 "|" }
  else if ((MODE=="DATA") && (NF>0)) { print }
}
 /START-OF-FIELDS/ { MODE="DEFINE"; HEADER="" }
 /START-OF-DATA/ {
      print HEADER
      MODE="DATA"
      HEADER=""
     }' | sed 's/|$//'

그러면 다음이 생성됩니다.

ID|NAME|DEPT
1|joy|cs
2|sam|ec
ID |NAME|DOB|DEPT|ADDRESS
5|joe|13/2/2001/|ee|street1
3|gwen|4/08/1999|cs|street2

참고: 저는 게을러서 헤더의 각 필드 뒤에 수직 막대를 추가했습니다. 그런 다음 SED 명령을 사용하여 후행 V바를 제거했습니다.

Answer

귀하의 문제는 더 잘 정의되어야 하지만 귀하의 예제 입력을 보면 귀하가 원하는 것이 무엇인지 추측하고 있습니다. 다음과 같은 작은 AWK 스크립트를 사용하십시오.

#!/bin/bash

awk '! /START-OF-/ {
  if (MODE=="DEFINE") { HEADER=HEADER $0 "|" }
  else if ((MODE=="DATA") && (NF>0)) { print }
}
 /START-OF-FIELDS/ { MODE="DEFINE"; HEADER="" }
 /START-OF-DATA/ {
      print HEADER
      MODE="DATA"
      HEADER=""
     }' | sed 's/|$//'

그러면 다음이 생성됩니다.

ID|NAME|DEPT
1|joy|cs
2|sam|ec
ID |NAME|DOB|DEPT|ADDRESS
5|joe|13/2/2001/|ee|street1
3|gwen|4/08/1999|cs|street2

참고: 저는 게을러서 헤더의 각 필드 뒤에 수직 막대를 추가했습니다. 그런 다음 SED 명령을 사용하여 후행 V바를 제거했습니다.

Question 4

sed -n '/^START-OF-DATA$/,/^$/{/^START-OF-DATA$/d;/^$/d;p;}' filename

그건:

START-OF-DATA- 와 다음 빈 줄 사이의 줄을 수집합니다 /^START-OF-DATA$/,/^$/. 다음 줄을 사용하면:
- 구분선을 제거 /^START-OF-DATA$/d하고/^$/d
- 나머지는 인쇄하세요 -p

Answer

sed -n '/^START-OF-DATA$/,/^$/{/^START-OF-DATA$/d;/^$/d;p;}' filename

그건:

START-OF-DATA- 와 다음 빈 줄 사이의 줄을 수집합니다 /^START-OF-DATA$/,/^$/. 다음 줄을 사용하면:
- 구분선을 제거 /^START-OF-DATA$/d하고/^$/d
- 나머지는 인쇄하세요 -p

동일한 파일에 여러 번 나타나는 두 문자열 사이의 데이터 수를 얻는 방법

답변1

답변2

답변3

답변4

관련 정보