단일 프로세스를 사용하면 AWK 프로세스가 하나의 거대한 파일 세트가 됩니다.

Question 1

매개변수가 너무 많으면 파일을 직접 열고 처리해야 합니다. awk를 사용하면 확장을 사용하지 않고도 다음을 사용할 수 있습니다(Jeff의 답변과 동일한 아이디어).

awk '{ filename = $0; while(getline < filename > 0) { print $0; }}'

예를 들어 find다음 명령을 결합하여 필요한 파일을 찾습니다.

find /etc/ -maxdepth 1 -type f -perm -444 -size 1 | \
  awk '{ filename = $0; while(getline < filename > 0) { print filename ":" $0; }}'

또한 awk 버전에 따라 처리를 위해 더 많은 파일을 푸시할 수 있습니다.여기에 문서화된 대로.

프로그램은 ARGC 및 ARGV의 요소를 변경할 수 있습니다. awk가 입력 파일의 끝에 도달할 때마다 ARGV의 다음 요소를 다음 입력 파일의 이름으로 사용합니다. 프로그램은 다른 문자열을 저장하여 읽는 파일을 변경할 수 있습니다. 표준 입력을 나타내려면 "-"를 사용하십시오. 추가 요소를 저장하고 ARGC를 증가시키면 추가 파일을 읽을 수 있습니다.

예를 사용하여 설명하십시오.

find /etc/ -maxdepth 1 -type f -perm -444 -size 1 | \
  awk '
    # When reading from STDIN, assume it is a list of files to read
    FILENAME == "-" { ARGV[ARGC] = $0; ARGC += 1 }
    # When not reading STDIN, it is a file to process
    FILENAME != "-" { print "---", FILENAME ":" FNR ":" $0; }
    # These will run after every file, including STDIN, hence the check
    BEGINFILE { if (FILENAME != "-") { print ">>>", FILENAME; } }
    ENDFILE   { if (FILENAME != "-") { print "<<<", FILENAME, FNR, "lines"; } }'

Answer

매개변수가 너무 많으면 파일을 직접 열고 처리해야 합니다. awk를 사용하면 확장을 사용하지 않고도 다음을 사용할 수 있습니다(Jeff의 답변과 동일한 아이디어).

awk '{ filename = $0; while(getline < filename > 0) { print $0; }}'

예를 들어 find다음 명령을 결합하여 필요한 파일을 찾습니다.

find /etc/ -maxdepth 1 -type f -perm -444 -size 1 | \
  awk '{ filename = $0; while(getline < filename > 0) { print filename ":" $0; }}'

또한 awk 버전에 따라 처리를 위해 더 많은 파일을 푸시할 수 있습니다.여기에 문서화된 대로.

프로그램은 ARGC 및 ARGV의 요소를 변경할 수 있습니다. awk가 입력 파일의 끝에 도달할 때마다 ARGV의 다음 요소를 다음 입력 파일의 이름으로 사용합니다. 프로그램은 다른 문자열을 저장하여 읽는 파일을 변경할 수 있습니다. 표준 입력을 나타내려면 "-"를 사용하십시오. 추가 요소를 저장하고 ARGC를 증가시키면 추가 파일을 읽을 수 있습니다.

예를 사용하여 설명하십시오.

find /etc/ -maxdepth 1 -type f -perm -444 -size 1 | \
  awk '
    # When reading from STDIN, assume it is a list of files to read
    FILENAME == "-" { ARGV[ARGC] = $0; ARGC += 1 }
    # When not reading STDIN, it is a file to process
    FILENAME != "-" { print "---", FILENAME ":" FNR ":" $0; }
    # These will run after every file, including STDIN, hence the check
    BEGINFILE { if (FILENAME != "-") { print ">>>", FILENAME; } }
    ENDFILE   { if (FILENAME != "-") { print "<<<", FILENAME, FNR, "lines"; } }'

Question 2

파일 이름에 따옴표나 공백이 포함되어 있지 않으면 한 가지 옵션은 함께 쌓는 것입니다 cat.

printf '%s ' * | xargs cat | awk ...

printf위의 코드는 내장()을 사용하여 각 파일 이름을 보내기 전에 인쇄하여 "인수 목록이 너무 김" 오류를 해결합니다. 그러면 xargs파일 이름을 일괄 처리로 분할하고 에 보낸 cat다음 출력을 에 보냅니다 awk.

그러나 xargs를 사용하지 마십시오

GNU awk(gawk)를 사용할 수 있는 경우4.1 이상, 디렉터리 자체를 읽을 수 있는 확장이 포함된 동적 모듈 로딩을 도입하여 문제를 우회합니다.

다음은 전달한 디렉터리의 파일을 열고 읽는 샘플 gawk 프로그램입니다. 그런 다음 관심 있는 각 파일을 명시적으로 읽어야 합니다. 이것의 장점은 각 파일을 읽을 수 있는 (GNU) awk 프로그램이 있다는 것입니다.

@load "readdir"
@load "filefuncs"

BEGIN { FS = "/" }
{
        result = stat($2, statdata)
        if (statdata["type"] != "file")
                next
        FS = " "
        while(getline < statdata["name"] > 0) {
                #print $1
        }
        FS = "/"
}

스크립트의 메인 루프는 명령줄에 제공된 각 인수를 반복하고 이를 디렉터리로 열려고 시도합니다. 결과 필드는 다음과 같습니다.

$1 = 아이노드 번호
$2 = 파일 이름
$3 = 파일 형식

그런 다음 filefuncs 함수를 사용하여 stat파일 유형을 확인합니다. 일반 파일이 아니면 건너뛰겠습니다. 그렇지 않으면 이를 FS다시 정상으로 설정 하고 이를 사용하여 getline파일을 읽습니다. 각 파일이 처리된 후 FS /에서 시작할 수 있도록 FS를 다시 재설정합니다 readdir.

나는 배웠다gawk의 readdir은 여기에 있습니다그리고 약gawk의 filefuncs 통계는 여기에 있습니다..

Answer