콘텐츠를 독립적으로 유지하면서 프로그램 간에 여러 파일의 콘텐츠를 전송합니다.

Question 1

다른 파일과 마찬가지로 파이프는 텍스트 스트림(보다 정확하게는 바이트 스트림)입니다. 유닉스의 기본 빌딩 블록은 단순한 경향이 있습니다. 프로세스 간의 상호 작용은 주로 비정형 데이터를 기반으로 합니다. 운영 체제는 파일 이름으로 레이블이 지정된 여러 스트림이 있는 통신 채널을 제공하지 않습니다. 프로그램이 이 작업을 수행해야 하는 경우 스트림당 파이프 하나씩 자체 파이프를 배열해야 하는 것이 가장 자연스러운 구현입니다.

program2및 가 각 스트림에 독립적으로 적용되는 경우 program3해당 복사본이 각 파일에 대해 실행됩니다. 순차적으로 실행하려면 쉘 루프를 사용하십시오. 파이프와 마찬가지로 루프는 프로그램을 서로 연결하는 셸 기능 중 하나입니다. 출력을 어디에 넣을지 알려주기 위해 program3일반적인 인터페이스는 program3표준 출력에 쓰고 출력을 파일로 지정하기 위해 셸의 리디렉션 구조를 사용하는 것입니다. 쉘은 파일 이름을 작성하기 위한 몇 가지 기본 문자열 조작 구성을 제공합니다. 이는 단지 연결일 뿐입니다.

for x in *.txt; do
  program1 "$x" | program2 | program3 >"folder/$x"
done

프로그램이 IO 집약적이지만 CPU 집약적이며 여러 개의 CPU가 있는 경우 병렬로 실행하는 것이 좋습니다. 충분히 새로운 GNU 도구를 사용하면 사용할 수 있습니다.xargs프로그램을 병렬로 실행합니다. 시스템의 CPU 수를 매개변수로 전달합니다 -P. 실행해야 하는 명령이 xargs파이프이므로 쉘을 호출하도록 만들어야 합니다.

find -maxdepth 1 -name '*.txt' -print0 |
xargs -0 -n 1 -P 4 sh -c 'program1 "$1" | program2 | program3 >"$0/$1"' "folder"

당신은 그것을 사용할 수 있습니다GNU 병렬xargs 대신 시스템의 CPU 수를 자동으로 결정합니다.

parallel sh -c 'program1 "$1" | program2 | program3 >"$0/$1"' "folder" ::: *.txt

단일 인스턴스가 필요 program2하고 program3여러 파일을 처리하는 경우 여러 파이프를 입력으로 수신하도록 사용자 정의 인터페이스를 사용하여 이러한 프로그램을 설계해야 합니다. 이를 수행하는 표준 방법은 없습니다. 한 가지 방법은 입력을 제공하는 프로그램을 호출하도록 하는 것입니다. 이는 출력을 처리하기 위해 어떤 프로그램을 호출할지 알려주는 것과 xargs비슷한 방식으로 작동합니다 .parallel

Answer

다른 파일과 마찬가지로 파이프는 텍스트 스트림(보다 정확하게는 바이트 스트림)입니다. 유닉스의 기본 빌딩 블록은 단순한 경향이 있습니다. 프로세스 간의 상호 작용은 주로 비정형 데이터를 기반으로 합니다. 운영 체제는 파일 이름으로 레이블이 지정된 여러 스트림이 있는 통신 채널을 제공하지 않습니다. 프로그램이 이 작업을 수행해야 하는 경우 스트림당 파이프 하나씩 자체 파이프를 배열해야 하는 것이 가장 자연스러운 구현입니다.

program2및 가 각 스트림에 독립적으로 적용되는 경우 program3해당 복사본이 각 파일에 대해 실행됩니다. 순차적으로 실행하려면 쉘 루프를 사용하십시오. 파이프와 마찬가지로 루프는 프로그램을 서로 연결하는 셸 기능 중 하나입니다. 출력을 어디에 넣을지 알려주기 위해 program3일반적인 인터페이스는 program3표준 출력에 쓰고 출력을 파일로 지정하기 위해 셸의 리디렉션 구조를 사용하는 것입니다. 쉘은 파일 이름을 작성하기 위한 몇 가지 기본 문자열 조작 구성을 제공합니다. 이는 단지 연결일 뿐입니다.

for x in *.txt; do
  program1 "$x" | program2 | program3 >"folder/$x"
done

프로그램이 IO 집약적이지만 CPU 집약적이며 여러 개의 CPU가 있는 경우 병렬로 실행하는 것이 좋습니다. 충분히 새로운 GNU 도구를 사용하면 사용할 수 있습니다.xargs프로그램을 병렬로 실행합니다. 시스템의 CPU 수를 매개변수로 전달합니다 -P. 실행해야 하는 명령이 xargs파이프이므로 쉘을 호출하도록 만들어야 합니다.

find -maxdepth 1 -name '*.txt' -print0 |
xargs -0 -n 1 -P 4 sh -c 'program1 "$1" | program2 | program3 >"$0/$1"' "folder"

당신은 그것을 사용할 수 있습니다GNU 병렬xargs 대신 시스템의 CPU 수를 자동으로 결정합니다.

parallel sh -c 'program1 "$1" | program2 | program3 >"$0/$1"' "folder" ::: *.txt

단일 인스턴스가 필요 program2하고 program3여러 파일을 처리하는 경우 여러 파이프를 입력으로 수신하도록 사용자 정의 인터페이스를 사용하여 이러한 프로그램을 설계해야 합니다. 이를 수행하는 표준 방법은 없습니다. 한 가지 방법은 입력을 제공하는 프로그램을 호출하도록 하는 것입니다. 이는 출력을 처리하기 위해 어떤 프로그램을 호출할지 알려주는 것과 xargs비슷한 방식으로 작동합니다 .parallel

Question 2

말을하는거야

program1 file1.txt   | program2 | program3 > folder/file1.txt
program1 file2.txt   | program2 | program3 > folder/file2.txt
program1 file42.txt  | program2 | program3 > folder/file42.txt
program1 green.txt   | program2 | program3 > folder/green.txt
program1 indigo.txt  | program2 | program3 > folder/indigo.txt
program1 leopard.txt | program2 | program3 > folder/leopard.txt
program1 lion.txt    | program2 | program3 > folder/lion.txt
   ⋮        ⋮            ⋮          ⋮                 ⋮

?

당신은 이것을 할 수 있습니다

for f in file1.txt file2.txt file42.txt green.txt indigo.txt leopard.txt lion.txt ...
do
    program1 "$f" | program2 | program3 > folder/"$f"
done

현재 디렉터리의 모든 텍스트 파일에 대해 이 작업을 수행하려면 와일드카드("globs"라고도 함)를 사용하면 됩니다.

for f in *.txt
do
    program1 "$f" | program2 | program3 > folder/"$f"
done

Answer

말을하는거야

program1 file1.txt   | program2 | program3 > folder/file1.txt
program1 file2.txt   | program2 | program3 > folder/file2.txt
program1 file42.txt  | program2 | program3 > folder/file42.txt
program1 green.txt   | program2 | program3 > folder/green.txt
program1 indigo.txt  | program2 | program3 > folder/indigo.txt
program1 leopard.txt | program2 | program3 > folder/leopard.txt
program1 lion.txt    | program2 | program3 > folder/lion.txt
   ⋮        ⋮            ⋮          ⋮                 ⋮

?

당신은 이것을 할 수 있습니다

for f in file1.txt file2.txt file42.txt green.txt indigo.txt leopard.txt lion.txt ...
do
    program1 "$f" | program2 | program3 > folder/"$f"
done

현재 디렉터리의 모든 텍스트 파일에 대해 이 작업을 수행하려면 와일드카드("globs"라고도 함)를 사용하면 됩니다.

for f in *.txt
do
    program1 "$f" | program2 | program3 > folder/"$f"
done

콘텐츠를 독립적으로 유지하면서 프로그램 간에 여러 파일의 콘텐츠를 전송합니다.

답변1

답변2

관련 정보