여러 파일에서 텍스트 줄을 추출하여 하나의 파일로 인쇄

Question 1

먼저 명령줄에서 몇 가지 유용한 쉘 변수를 정의합니다.

$ d='[0-9]'
$ pre='TrkNbr_1083n1282_L1n2_PrelimPops'
$ main="$d${d}SubSampPops_Rep$d$d$d"
$ post='GenDivRslts'
$ filename="${pre}_${main}_${post}"

GNU 사용 awk:

$ find . -type f -name "$filename"      |
  sort -t_ -nk5.1,5.2 -nk6.4,6.6        |
  xargs -r awk 'FNR==2{print;nextfile}' \
> new_text_file;

GNU 사용 sed:

$ find . -type f -name "$filename" |
  sort -t_ -nk5.1,5.2 -nk6.4,6.6   |
  xargs -r sed -se '2!d'           \
> new_text_file;

그리고 perl:

$ find . -type f -name "$filename"                |
  sort -t_ -nk5.1,5.2 -nk6.4,6.6                  |
  xargs -r perl -ne 'print,close ARGV if $. == 2' \
> new_text_file;

그리고 head/tail:

$ find . -type f -name "$filename" |
  sort -t_ -nk5.1,5.2 -nk6.4,6.6   |
  xargs -r \
   sh -c '
    for f
    do
     head -n 2 "$f" | tail -n 1
    done
   ' x > new_text_file;

Answer

먼저 명령줄에서 몇 가지 유용한 쉘 변수를 정의합니다.

$ d='[0-9]'
$ pre='TrkNbr_1083n1282_L1n2_PrelimPops'
$ main="$d${d}SubSampPops_Rep$d$d$d"
$ post='GenDivRslts'
$ filename="${pre}_${main}_${post}"

GNU 사용 awk:

$ find . -type f -name "$filename"      |
  sort -t_ -nk5.1,5.2 -nk6.4,6.6        |
  xargs -r awk 'FNR==2{print;nextfile}' \
> new_text_file;

GNU 사용 sed:

$ find . -type f -name "$filename" |
  sort -t_ -nk5.1,5.2 -nk6.4,6.6   |
  xargs -r sed -se '2!d'           \
> new_text_file;

그리고 perl:

$ find . -type f -name "$filename"                |
  sort -t_ -nk5.1,5.2 -nk6.4,6.6                  |
  xargs -r perl -ne 'print,close ARGV if $. == 2' \
> new_text_file;

그리고 head/tail:

$ find . -type f -name "$filename" |
  sort -t_ -nk5.1,5.2 -nk6.4,6.6   |
  xargs -r \
   sh -c '
    for f
    do
     head -n 2 "$f" | tail -n 1
    done
   ' x > new_text_file;

Question 2

왜 간단하지 않은가?

awk 'FNR == 2' *FstRslts > NewFile

? 명령줄이 너무 길어지면 입력 파일을 하위 구분별로 그룹화하거나 xargs줄 분할을 사용해 보세요.

Answer

왜 간단하지 않은가?

awk 'FNR == 2' *FstRslts > NewFile

? 명령줄이 너무 길어지면 입력 파일을 하위 구분별로 그룹화하거나 xargs줄 분할을 사용해 보세요.

Question 3

zsh버전(Mac 터미널의 기본 셸):

for file in $(find . -type f -iname "*.txt"); cat "$file" | head -2 | tail -1 >> output.txt

이는 모든 입력 텍스트 파일이 동일한 디렉터리에 있고 파일이 처리되는 순서가 중요하지 않다고 가정합니다.

bash버전:

for file in $(find . -type f -iname "*.txt"); do cat $file | head -2 | tail -1; done >> output.txt

편집 1:echo명령 대체에 대해 Nasir와 Steeldriver의 제안을 따를 필요는 없습니다. 다음은 awk 버전입니다.

for file in $(find . -type f -iname "*.txt"); awk 'NR==2' $file >> output.txt

그리고 파일에 확장자가 없으면 txt모든 파일에 공통된 패턴을 사용할 수 있습니다. 모든 파일의 File이름에 해당 이름이 있다고 가정하면 awk버전은 다음과 같을 수 있습니다.

for file in $(find . -type f -iname "*File*"); awk 'NR==2' $file >> output.txt

편집 2:

언급하신 내용에 따르면 FstRslts합계는 GenDivRslts파일 그룹의 고유 식별자입니다. 따라서 파일 "*FstRslts"에 대해 FstRslts대신 사용할 수 있습니다 "*.txt".GenDivRslts

노트

나는 @steeldrivers의 조언과 교훈을 받아들이고 답변 중 하나로 다음을 추가합니다(보다 관용적임).

find . -type f -iname "*FstRslts" -exec awk 'NR==2' {} \; > output.txt

편집 3 find .- 현재 작업 디렉토리에서 검색 시작

type -f- 파일 형식 검색

-iname "*FstRslts"- 패턴과 일치하는 파일명 검색 시 대소문자 무시

-exec- 다음 명령을 실행합니다.

awk 'NR==2'- 이전 명령으로 발견된 각 파일의 두 번째 줄 추출(일치하는 패턴)

{} \;- 파일(패턴 일치) 명령 종료를 위한 자리 표시자

> output.txt- 결과를 "output.txt" 파일 이름으로 리디렉션합니다.

Answer