결과를 수집하기 위해 많은 수의 파일(300,000개 이상)을 처리하는 보다 효율적인 방법은 무엇입니까?

Question 1

내가 올바르게 이해했다면 fields.txt줄이 많은 파일이 있습니다. 파일이 여러 개 있습니다 res-0-n-0. 그리고 각 줄에 대해 파일 내용 fields.txt에 복사합니다 (존재하는 경우) .results.txtres-0-<line_number>

나는 단순히 fields.txt파일을 한 줄씩 읽고 results.txt필요에 따라 파일 내용의 줄을 에코할 수 있다고 생각합니다.res-0-<line_number>

나는 다음과 같은 것을 선택할 것입니다 :

#! /bin/sh

LINE_NUMBER=0
while read line;
do
  if [ -f "res-0-$LINE_NUMBER-0" ]
  then
    echo "$line $(cat res-0-$LINE_NUMBER-0)" >> result.txt
  else
    echo "$line" >> result.txt
  fi
  ((LINE_NUMBER++))
done < fields.txt

Answer

내가 올바르게 이해했다면 fields.txt줄이 많은 파일이 있습니다. 파일이 여러 개 있습니다 res-0-n-0. 그리고 각 줄에 대해 파일 내용 fields.txt에 복사합니다 (존재하는 경우) .results.txtres-0-<line_number>

나는 단순히 fields.txt파일을 한 줄씩 읽고 results.txt필요에 따라 파일 내용의 줄을 에코할 수 있다고 생각합니다.res-0-<line_number>

나는 다음과 같은 것을 선택할 것입니다 :

#! /bin/sh

LINE_NUMBER=0
while read line;
do
  if [ -f "res-0-$LINE_NUMBER-0" ]
  then
    echo "$line $(cat res-0-$LINE_NUMBER-0)" >> result.txt
  else
    echo "$line" >> result.txt
  fi
  ((LINE_NUMBER++))
done < fields.txt

Question 2

sed 스크립트를 생성한 후 파일에 한 번만 적용해 보세요 field.txt.

while IFS='' read -r line; do
    res=$(<res-0-"$line"-0)
    real_line=$(( line + 1 ))
    prinft "%s" "${real_line}s/.$/ ${res}/" >> myscript.sed
done < res_numbers_sorted.tmp

그런 다음 다음을 수행하십시오.

sed -i -f myscript.sed field.txt

이렇게 하면 대용량 파일에 대해 한 번만 반복하면 됩니다. 이것이 도움이 된다면 알려주세요.

Answer

sed 스크립트를 생성한 후 파일에 한 번만 적용해 보세요 field.txt.

while IFS='' read -r line; do
    res=$(<res-0-"$line"-0)
    real_line=$(( line + 1 ))
    prinft "%s" "${real_line}s/.$/ ${res}/" >> myscript.sed
done < res_numbers_sorted.tmp

그런 다음 다음을 수행하십시오.

sed -i -f myscript.sed field.txt

이렇게 하면 대용량 파일에 대해 한 번만 반복하면 됩니다. 이것이 도움이 된다면 알려주세요.

결과를 수집하기 위해 많은 수의 파일(300,000개 이상)을 처리하는 보다 효율적인 방법은 무엇입니까?

답변1

답변2

관련 정보