크기가 고르지 않은 두 개의 정렬된 명명된 파이프를 병합하는 방법은 무엇입니까?

Question

분명히 두 개의 명명된 파이프에 서로 다른 양의 데이터를 쓰면 프로그램이 교착 상태에 빠질 것입니다. 1 fifo2(버퍼가 가득 찼음)에 대해 프로그램이 write차단되고 fifo1 (버퍼가 비어 있음) sort에 대해 프로세스가 차단됩니다 .read

sort당신은 그것을 실현하는 방법을 모릅니다 . 파일을 더 큰 덩어리로 읽은 다음 메모리에서 데이터를 처리하여 보다 효율적으로 처리할 수 있습니다. 데이터를 읽는 함수를 사용하면 sort버퍼링이 자동으로 발생할 수도 있습니다 .stdio.h

명명된(및 명명되지 않은) 파이프는 데이터 버퍼를 사용합니다.
버퍼가 가득 차면 읽기 프로세스가 일부 데이터를 읽거나 끝을 닫을 때까지 쓰기 프로세스가 차단됩니다.
버퍼가 비어 있으면 쓰기 프로세스가 일부 데이터를 쓰거나 끝날 때까지 읽기 프로세스가 차단됩니다.

각 사이클에서 fifo1에 한 줄, fifo2에 두 줄을 쓰면 fifo2의 버퍼는 채워지는 반면 fifo1의 버퍼는 절반만 채워집니다.

sort프로그램이 fifo에 쓰는 데이터의 양과 읽고 싶은 데이터의 양 에 따라 이는 분명히 sortfifo1에서 무언가를 읽고 싶은데 프로그램에 빈 버퍼가 있고 프로그램이 쓰기를 원하는 상황으로 이어질 수 있습니다. 전체 버퍼가 있는 fifo2입니다.

sort파이프 버퍼의 크기는 고정되어 있고 프로그램도 고정된 크기를 가지며 고정된 버퍼 크기를 사용하여 데이터를 읽거나 쓸 수 있으므로 결과는 결정적입니다 .

GNU 소스 코드를 볼 수 있습니다 sort:
https://github.com/wertarbyte/coreutils/blob/master/src/sort.c

처음에는 모든 파일에 대한 루프의 함수를 사용하여 모든 입력 파일의 입력 버퍼를 채우려고 합니다 fillbuf.

나중에 어떤 경우에는 fillbuf입력 파일을 다시 호출합니다.

함수에 fillbuf주석이 있습니다

          /* Read as many bytes as possible, but do not read so many
             bytes that there might not be enough room for the
             corresponding line array.  The worst case is when the
             rest of the input file consists entirely of newlines,
             except that the last byte is not a newline.  */

분명히 sort입력 파일을 선택하고 일정량의 데이터가 필요합니다. 읽기가 차단되면 입력 파일이 전환되지 않습니다.

read이 구현은 작업이 잠시 후 일부 데이터 또는 EOF를 반환하므로 영원히 차단되지 않으므로 일반 파일에 잘 작동합니다 .

두 프로세스/스레드 사이를 차단할 수 있는 것이 두 개 이상인 경우 교착 상태를 피하는 것은 항상 어렵습니다. 귀하의 경우 하나의 파이프만 사용해야 합니다. 항상 fifo1에 쓸 데이터가 있고(fifo2가 차단하는 경우) 반대의 경우에는 비차단 작업을 사용하는 것이 도움이 될 수 있습니다.

두 개의 별도 스레드/프로세스를 사용하여 파이프에 쓰는 경우 두 개의 파이프를 사용하는 것이 작동할 수 있지만 스레드/프로세스가 서로 독립적으로 작동하는 경우에만 가능합니다. 파이프라인1에 쓰기로 되어 있는 스레드 A가 어떻게든 스레드 B(파이프라인2에 쓸 때만 차단됨)를 기다리고 있는 경우 이는 도움이 되지 않습니다.

Answer 1