가변 개수의 CSV를 연결하고 헤더 행을 제거하는 방법은 무엇입니까?

Question 1

#!/bin/bash
for i in {01..84}; do
    x=$(printf '%02d' $i)
    set -- $x?*.csv
    if [ -f "$1" ]; then
        cp "$1" $i.csv
        shift
        if [ -f "$1" ]; then
            tail -q -n +2 "$@" >> $x.csv
        fi
    fi
done

각 접두사에 대해 해당 접두사가 있는 파일 목록을 인수로 설정하여 $1첫 번째 등에 액세스 하는 데 사용할 수 있습니다.

$1파일인 경우 (주어진 접두어를 가진 파일이 없는 경우를 잡기 위해) 해당 파일을 prefix.csv에 복사합니다. 그런 다음 첫 번째 파일을 이동하고 다음 파일도 파일인지 확인하여 해당 접두사가 있는 파일이 여러 개 있는지 확인합니다. 그렇다면 명령을 통해 각 파일의 헤더 행을 건너뛰고 tailprefix.csv에 추가하세요.

인수 목록에 여러 파일이 전달되면 헤더 줄 자체를 억제하는 옵션 이 추가됩니다 -q.tailtail==> 19XXX.csv <==

해당 옵션이 솔루션에 필요한 전부일 수 있지만 -q지나치게 복잡하고 bash명령 출력 등을 버퍼링 해야 하므로 tail스크립트가 조기에 중지(충돌?)되는 이유일 수 있습니다.

편집: 앞에 0이 없이 1 2 3 ...으로 확장되도록 x=$(printf '%02d' $i)추가 되었습니다.{01..84}

Answer

#!/bin/bash
for i in {01..84}; do
    x=$(printf '%02d' $i)
    set -- $x?*.csv
    if [ -f "$1" ]; then
        cp "$1" $i.csv
        shift
        if [ -f "$1" ]; then
            tail -q -n +2 "$@" >> $x.csv
        fi
    fi
done

각 접두사에 대해 해당 접두사가 있는 파일 목록을 인수로 설정하여 $1첫 번째 등에 액세스 하는 데 사용할 수 있습니다.

$1파일인 경우 (주어진 접두어를 가진 파일이 없는 경우를 잡기 위해) 해당 파일을 prefix.csv에 복사합니다. 그런 다음 첫 번째 파일을 이동하고 다음 파일도 파일인지 확인하여 해당 접두사가 있는 파일이 여러 개 있는지 확인합니다. 그렇다면 명령을 통해 각 파일의 헤더 행을 건너뛰고 tailprefix.csv에 추가하세요.

인수 목록에 여러 파일이 전달되면 헤더 줄 자체를 억제하는 옵션 이 추가됩니다 -q.tailtail==> 19XXX.csv <==

해당 옵션이 솔루션에 필요한 전부일 수 있지만 -q지나치게 복잡하고 bash명령 출력 등을 버퍼링 해야 하므로 tail스크립트가 조기에 중지(충돌?)되는 이유일 수 있습니다.

편집: 앞에 0이 없이 1 2 3 ...으로 확장되도록 x=$(printf '%02d' $i)추가 되었습니다.{01..84}

Question 2

#!/bin/sh
for i in {01..84}
do
  cat $i*.csv > $i.csv-concat
  rm $i*.csv
  mv $i.csv-concat $i.csv
done

cat을 잊지 마세요. 이것은 연결 도구입니다. tail도 작업을 수행하고 헤더를 제거할 수 있습니다.

#!/bin/sh
pushd [workdir]
for i in {01..84}
do
  echo $i*.csv | xargs -n 1 tail -n+2 > $i.csv-concat
  rm $i*.csv
  mv $i.csv-concat $i.csv
done
popd

Answer

#!/bin/sh
for i in {01..84}
do
  cat $i*.csv > $i.csv-concat
  rm $i*.csv
  mv $i.csv-concat $i.csv
done

cat을 잊지 마세요. 이것은 연결 도구입니다. tail도 작업을 수행하고 헤더를 제거할 수 있습니다.

#!/bin/sh
pushd [workdir]
for i in {01..84}
do
  echo $i*.csv | xargs -n 1 tail -n+2 > $i.csv-concat
  rm $i*.csv
  mv $i.csv-concat $i.csv
done
popd

Question 3

여기에 있는 모든 사람을 위한 작업 코드 솔루션은 wurtel 기반 복사 붙여넣기:

#!/bin/bash
for i in {01..84}; do
    #declare array to store files with same prefix
    declare -a files=()
    echo "Processing $i"
    for j in `ls $i*.csv`; do
        #add files with same prefix to array
        files=("${files[@]}" "$j")
    done
    #cat first file including header with the rest of the files without the headers
    if [ ${#files[@]} -gt 1 ]; then
        cat <(cat ${files[@]:0:1}) <(tail -q -n+2 ${files[@]:1}) > "$i".csv
    else
        cat <(cat ${files[@]:0:1}) > "$i".csv
    fi
done

Stéphane Chazelas는 awk를 사용합니다. 훨씬 더 깨끗합니다.

#!/bin/bash
for i in {01..84}; do
        echo "processing $i"
        awk 'NR==FNR||FNR>1' $i?*.csv >> "$i".csv
done

Answer

여기에 있는 모든 사람을 위한 작업 코드 솔루션은 wurtel 기반 복사 붙여넣기:

#!/bin/bash
for i in {01..84}; do
    #declare array to store files with same prefix
    declare -a files=()
    echo "Processing $i"
    for j in `ls $i*.csv`; do
        #add files with same prefix to array
        files=("${files[@]}" "$j")
    done
    #cat first file including header with the rest of the files without the headers
    if [ ${#files[@]} -gt 1 ]; then
        cat <(cat ${files[@]:0:1}) <(tail -q -n+2 ${files[@]:1}) > "$i".csv
    else
        cat <(cat ${files[@]:0:1}) > "$i".csv
    fi
done

Stéphane Chazelas는 awk를 사용합니다. 훨씬 더 깨끗합니다.

#!/bin/bash
for i in {01..84}; do
        echo "processing $i"
        awk 'NR==FNR||FNR>1' $i?*.csv >> "$i".csv
done

가변 개수의 CSV를 연결하고 헤더 행을 제거하는 방법은 무엇입니까?

답변1

답변2

답변3

관련 정보