1200페이지 문서를 500페이지로 나눈 후 나머지 페이지를 500페이지로 나눕니다.

Question 1

^L모든 페이지가 (text)로 시작한다고 가정합니다 Ctrl+L.

awk '/^L/ { p++ } (p-1) % 500 == 0 { f = FILENAME "-page-" p ".txt" } { print > f }' file.txt

행 수를 계산하고 ^L, 1을 뺀 값이 500의 인수인 경우(1페이지, 501페이지, 1001페이지 등) 변수를 f파일 이름으로 설정하여 다음 텍스트를 출력합니다.

^L코드의 내용은 awk다음과 같습니다.아니요2개의 문자 ^와 L1개의 리터럴 Ctrl+L(입력을 사용할 수 있음 Ctrl+VCtrl+L) 대신 이것을 사용할 수도 있습니다 \014.

작은 테스트 문서의 경우 test.txt:

^L
page 1
^L
page 2
^L
page 3
^L
page 4

...테스트를 위해 500을 2로 변경하면 두 개의 파일이 생성되고 test.txt-page-1.txt각 test.txt-page-3.txt파일에는 입력 파일의 두 줄(페이지 마크업 및 텍스트)이 포함됩니다.

test.txt-page-1.txt:

^L
page 1
^L
page 2

test.txt-page-3.txt:

^L
page 3
^L
page 4

구문 분석할 파일에는 분명히 첫 번째 페이지 표시 앞에 헤더가 있습니다. 이 헤더는 무시해야 합니다. 위 명령의 다음 변형은 awk이를 수행합니다.

awk '/^L/ { p++ } (p-1) % 500 == 0 { f = FILENAME "-page-" p ".txt" } p > 0 { print > f }' file.txt

출력을 p0보다 크게 제한함으로써 출력되기 전에 적어도 하나의 페이지 태그를 구문 분석해야 합니다.

Answer

^L모든 페이지가 (text)로 시작한다고 가정합니다 Ctrl+L.

awk '/^L/ { p++ } (p-1) % 500 == 0 { f = FILENAME "-page-" p ".txt" } { print > f }' file.txt

행 수를 계산하고 ^L, 1을 뺀 값이 500의 인수인 경우(1페이지, 501페이지, 1001페이지 등) 변수를 f파일 이름으로 설정하여 다음 텍스트를 출력합니다.