Windows에서 복사한 중국어 간체 문자 인코딩이 포함된 디스크가 있습니다.
이제 centos7을 설치하고 중국어 번체 문자 인코딩을 사용하고 있습니다.
1 이 디스크를 어떻게 마운트하나요?
ntfs-3g /dev/sdb /mnt/windows -o locale=zh_CN.GBK 명령을 사용했지만 여전히 파일 이름이 엉망입니다.
2 이 파일을 복사하는 방법은 무엇입니까?
cp -r 명령을 사용한 다음 인쇄합니다.
cp -r /mnt/7 /home/jl/file/7 cp: '/mnt/7/20140206/\275̰\270/\261\270\277\316'에 액세스할 수 없습니다: 적용할 수 없거나 불완전한 다중 비트 튜플 문자 또는 와이드 문자 cp: '/mnt/7/20140206/\275̰\270/֪ʶ\265\343'에 액세스할 수 없습니다.: 부적절하거나 불완전한 멀티 바이트 문자 또는 와이드 문자 cp: '/mnt/7/20140206에 액세스할 수 없습니다. /\277τ\274\273': 적용할 수 없거나 불완전한 멀티바이트 문자 또는 와이드 문자
아마 글을 안읽으셨을텐데, 부적절한 문자(?)로 인해 cp를 실행할 수 없다는 뜻입니다.
이 문제는 운영 체제의 다양한 경로 구분 기호로 인해 발생하는 것 같습니다.
나는 convmv -f gbk -t big5 -r --notest /home/jl/file/7을 시도했지만 그것도 실패했습니다.
이 디렉토리를 복사하려면 scp를 사용해야 합니까?
답변1
먼저, 다른 인코딩 프로토콜인 Windows 인코딩을 다루고 있습니다.UTF-16, Linux 및 OSX의 기본값은 다음과 같습니다.UTF-8.
따라서 인코딩을 다음으로 설정했지만UTF-8Linux에 데이터 힙을 설치할 때 데이터는 다음과 같이 인코딩됩니다.UTF-16Windows를 통해.
파일 이름에 UTF-8에서 올바르게 읽을 수 없는 멀티바이트 문자가 포함된 것 같습니다. 일반적으로 이중 언어를 구사하는 직원과 작업할 때 이러한 어려움을 피하기 위해 파일 이름에 UTF-8의 악센트 없는 문자(처음 128자)를 고수하라고 지시합니다.
파일 이름의 문자 인코딩 차이로 인해 TAR 백업을 다른 인코딩을 사용하는 시스템에 복원할 때 문제가 발생할 수 있습니다.
어쨌든 ICU를 사용하여 인코딩을 변환할 수 있습니다.http://site.icu-project.org/.
HTH 너 아웃-