pdftex에 대해 영국 이외의 비ASCII 비LaTeX 문자를 찾는 방법은 무엇입니까?

Question

[\x80-\xFF]128에서 255까지의 코드 포인트만 포함됩니다. 로케일, 특히 문자 인코딩에 따라 비ASCII 문자 세트일 수도 있고 아닐 수도 있습니다. 이는 8비트 인코딩에만 존재합니다. (정확하게 말하면 ASCII 기반 8비트 인코딩이지만 다른 인코딩을 접할 가능성은 거의 없습니다.) 사실상의 표준 UTF-8을 포함하여 문자가 개별 바이트가 아닌 로케일에서는 비 [\x80-\xFF]- ASCII 문자 작은 부분.

ASCII가 아닌 문자를 검색하는 가장 쉬운 방법은 C 로케일을 강제 적용하는 것입니다. C 언어 환경에서 문자는 바이트입니다. 단일 바이트 로케일을 사용하면 일부 버전의 GNU grep을 훨씬 더 빠르게 만들 수도 있습니다.

LC_ALL=C grep --color='auto' -P -n "[\x80-\xFF]" file.tex

Answer 1

[\x80-\xFF]128에서 255까지의 코드 포인트만 포함됩니다. 로케일, 특히 문자 인코딩에 따라 비ASCII 문자 세트일 수도 있고 아닐 수도 있습니다. 이는 8비트 인코딩에만 존재합니다. (정확하게 말하면 ASCII 기반 8비트 인코딩이지만 다른 인코딩을 접할 가능성은 거의 없습니다.) 사실상의 표준 UTF-8을 포함하여 문자가 개별 바이트가 아닌 로케일에서는 비 [\x80-\xFF]- ASCII 문자 작은 부분.

ASCII가 아닌 문자를 검색하는 가장 쉬운 방법은 C 로케일을 강제 적용하는 것입니다. C 언어 환경에서 문자는 바이트입니다. 단일 바이트 로케일을 사용하면 일부 버전의 GNU grep을 훨씬 더 빠르게 만들 수도 있습니다.

LC_ALL=C grep --color='auto' -P -n "[\x80-\xFF]" file.tex

pdftex에 대해 영국 이외의 비ASCII 비LaTeX 문자를 찾는 방법은 무엇입니까?

도구 테스트를 거쳤지만 Gils 이후에는 이점이 없습니다.답변

내가 잘 모르는 것들

답변1

관련 정보