대규모 데이터 세트를 여러 부분으로 효율적으로 보관하고 압축하는 방법은 무엇입니까?

Question

언제든지 다음과 같이 할 수 있습니다.

for part in dataset.tar.lz4.part*; do
  cat < "$part" || break
  rm -f -- "$part"
done |
  tar \
  --extract \
  --directory ~/data/dataset \
  --use-compress-program lz4 \
  --verbose

gz압축 파일 에 - 접미사를 사용 하지 마십시오 lz4. 이는 오해의 소지가 있으며 gz에 적용됩니다 gzip.

Answer 1

언제든지 다음과 같이 할 수 있습니다.

for part in dataset.tar.lz4.part*; do
  cat < "$part" || break
  rm -f -- "$part"
done |
  tar \
  --extract \
  --directory ~/data/dataset \
  --use-compress-program lz4 \
  --verbose

gz압축 파일 에 - 접미사를 사용 하지 마십시오 lz4. 이는 오해의 소지가 있으며 gz에 적용됩니다 gzip.

대규모 데이터 세트를 여러 부분으로 효율적으로 보관하고 압축하는 방법은 무엇입니까?

답변1

관련 정보