wget은 3바이트 따옴표를 출력합니다.

wget은 3바이트 따옴표를 출력합니다.

wget -b로그에서 성공적으로 다운로드된 파일 목록을 얻으려고 시도했지만 성공 grep saved wget-log | awk -F '"' '{print $2}'하지 못했습니다. 추가 조사를 통해 파일 이름이 일반 큰따옴표(0x22) 대신 3바이트의 왼쪽 및 오른쪽 큰따옴표(0xE2 0x80 0x9D)로 묶여 있음을 발견했습니다.

이것이 wget의 정상적인 동작인가요, 아니면 제 환경 변수인가요? wget에서 일반 따옴표를 사용하도록 할 수 있습니까, 아니면 로깅에 표준 ASCII 바이트를 사용할 수 있습니까? 나는 바이트를 sed로 바꾸는 것과 같은 문제를 해결하는 다른 방법을 알고 있습니다. 나는 이것에 매우 관심이 있습니다. 나는 이것에 대한 의견을 찾기 위해 Google에서 몇 분을 보냈지 만 아무것도 찾을 수 없었습니다. 마치 이전에 아무도 이것을 눈치 채지 못한 것 같습니다.

답변1

유니코드 로케일로 설계된 것 같습니다. 이에 대한 댓글이 있습니다wget 메일링 리스트. 언어 번역 파일에는 인용문 번역도 포함되어 있으므로 사용 중인 언어에 따라 "올바른" 인용문을 얻을 수 있습니다.

유니코드가 아닌 로케일을 사용하여 일반 따옴표를 사용하도록 할 수 있습니다.

LC_ALL=C wget ...

또는

LC_CTYPE=C wget ...

관련 정보