일부 영화 파일(.MPG)을 (ftp를 통해) 원격 컴퓨터로 전송해야 합니다. 먼저 압축해서 보내려고 합니다. 그러나 모든 압축 유틸리티(gzip, bzip2 및 zip)는 압축 비율이 매우 낮습니다. 예를 들어:
ravbholua@ravbholua-Aspire-5315:~/Desktop/MAIL/SNEHAMILAN$ gzip -l MOV04042.MPG.gz
compressed uncompressed ratio uncompressed_name
61949207 66970629 7.5% MOV04042.MPG
ravbholua@ravbholua-Aspire-5315:~/Desktop/MAIL/SNEHAMILAN$
여기에서 볼 수 있듯이 압축이 적습니다. bzip2와 zip의 경우에도 마찬가지입니다. 400MB의 영화 파일을 크게 압축한 다음 FTP를 통해 전송할 수 있도록 더 나은 압축 유틸리티를 제안해 주세요. 내가 하는 일은 먼저 모든 영화 파일을 tar로 압축한 다음 원격 시스템의 ftp로 압축하는 것입니다.
답변1
대부분의 영화 형식/인코딩(이미지 형식 포함)은 이미 압축되어 있습니다. bzip2 압축 아카이브를 압축하려는 경우와 마찬가지로(또는 그 반대로) 두 번째 압축 레이어를 추가하여 더 이상 압축할 수 없습니다.
이러한 파일을 추가로 압축할 수 있는 무손실 압축 알고리즘은 찾을 수 없습니다. 실제로 약간 압축된 파일을 얻을 수도 있습니다.더 큰어떤 경우에는 원본보다 낫습니다.
미디어 파일을 더욱 압축할 수 있는 가장 좋은 방법은 보다 효율적인 인코더를 사용하여 오디오와 비디오를 다시 압축하는 것입니다. .mpg
예를 들어 확장 프로그램에서는 현재 MPEG-2를 사용하고 있다고 제안하므로 다음으로 전환해 볼 수 있습니다.H.264또는VP8/웹M. 기존 인코더의 매개변수를 변경하여 더 작은 파일을 얻을 수도 있으며, 더 작은 파일을 사용하는 대신 일부 품질을 희생할 수도 있습니다. 단일 파일 전송으로 절약하는 것보다 다시 인코딩하는 데 더 많은 CPU 시간이 소요될 수 있지만 이러한 파일을 여러 번 전송하는 경우에는 그만한 가치가 있을 수 있습니다.
답변2
대부분의 무손실 압축(예: gzip, bzip2 및 zip에 사용되는 알고리즘)은 파일에서 길게 반복되는 바이트 시퀀스를 제거하여 작동합니다. 인위적인 예로, 파일에 100개의 공백이 있는 여러 인스턴스가 있다고 가정해 보겠습니다. 파일의 압축 버전은 100개의 공백을 나타내는 매우 짧은 코드를 생성하고 이러한 인스턴스를 이것으로 바꿀 수 있습니다.
문제는 이것이 작동하려면 파일에 큰 반복 바이트 시퀀스가 있어야 한다는 것입니다. 대부분의 일반 파일은 괜찮습니다. 이것이 압축이 일반적으로 잘 작동하는 이유이지만 압축된 파일은 일반적으로 그렇지 않습니다(압축의 요점). 이것이 이중 압축이 일반적으로 잘 작동하지 않는 이유입니다. 파일을 한 번 압축한 후에 압축 가능하게 만든 대부분의 콘텐츠가 제거되었습니다. 흥미롭게도 압축으로 실제로 만들 수 있는 파일을 만드는 것이 가능합니다.더 큰, 그러나 실용적인 관점에서 볼 때 이러한 파일은 자주 나타나지 않습니다.
손실 압축은 실제로 그렇게 다르지 않습니다. 가장 간단한 의미에서는 파일을 더 잘 압축하기 위해 어떤 방식으로든 파일을 변경하지만 사용자가 눈치채지 못하는 방식으로 시도합니다. 오디오 압축에서는 이를 다음과 같이 부릅니다.심리음향학알고리즘은 인간의 두뇌가 감지할 수 없는 방식으로 오디오를 변경하는 것이기 때문에 비디오 압축과 비슷한 단어가 있는 것 같지만 그것이 무엇인지는 모르겠습니다. 어쨌든, 파일을 더 압축하기 쉽게 만드는 트릭을 수행한 후에는 일반적인 방법으로 압축합니다. 그러나 이는 손실이 있는 압축 파일에는 무손실 알고리즘이 찾는 것이 많지 않다는 것을 의미합니다.
그래서 당신에게 행운이 없을까 두렵습니다. @WarrenYoung의 답변은 원본 비디오에 액세스할 수 있으면 작동하지만 이러한 .mpg 파일만 있는 경우 다시 인코딩할 때 주의해야 합니다. 파일이나 기타 항목이 손상되지는 않지만 결과가 손상됩니다. 처럼 보이지 않을 수도 있습니다. 원본 파일로 시작하는 것도 좋습니다. 서로 다른 손실 알고리즘은 서로 다른 유형의 데이터를 삭제하지만 그렇게 하면 그 효과가 합산되어 눈에 띄게 될 수 있습니다. 다시 인코딩을 마친 후에는 파일이 여전히 괜찮은지 확인해야 합니다.