인터넷 관련 애플리케이션에서 잘못된 문자 렌더링

인터넷 관련 애플리케이션에서 잘못된 문자 렌더링

아래 이미지를 참조하세요.

타밀어 문자가 포함된 이미지

보시다시피, "häufigkeit"라는 단어의 "ä"는타밀 사람글리프. 이는 ASCII가 아닌 거의 모든 문자에서 발생합니다. 예를 들어 탭 표시줄에서는 제목 뒤에 줄임표가 있어야 합니다. 대신 다른 타밀어 문자 모양으로 렌더링됩니다.

그러나 그것은 진실이 아니다. 아래 이미지를 참조하세요.

올바른 유니코드 문자가 포함된 이미지

주황색으로 강조 표시된 단어에서 "ä"가 올바르게 렌더링된 것을 볼 수 있습니다.

타밀어 문자의 등장에는 어떤 패턴도 관찰되지 않는 것 같습니다. 대부분의 경우 이런 경우인 것 같습니다. 편집 가능한 텍스트에서는 HTML 렌더링 텍스트에 올바른 문자가 나타나고 타밀어 문자가 나타납니다. 예를 들어, 질문을 입력하면 입력한 질문에 ASCII가 아닌 모든 문자가 올바르게 표시되지만 질문 미리 보기에서는 타밀어 문자가 다시 나타납니다. 위 이미지에서처럼 이는 엄격한 규칙은 아닙니다. 주황색 ​​단어는 편집 가능한 텍스트 블록의 일부가 아니며 여전히 올바르게 렌더링됩니다.

그리고 이는 인터넷 관련 앱의 문제인 것 같습니다. Emacs는 일반적으로 모든 문자를 완벽하게 렌더링합니다. 하지만 내가 열면이것사이트 위치는 다음과 같습니다.전자 세계, 비ASCII 문자 대신 타밀어 문자가 다시 나타납니다.

무슨 일이 일어나는지 알아보기 위해 타밀어 글꼴을 제거해 보았으나 개선되지 않았습니다. 이러한 문자는 여전히 렌더링됩니다. 나는 그것(렌더러)이 그것들을 어디서 가져오는지 모릅니다.

fc-list | grep Tamil, 및 fc-list | grep tamil의 출력은 fc-list | grep indic모두 비어 있습니다.

이 동작을 설명하는 방법에 대한 아이디어가 있습니까?

고쳐 쓰다:

C-u C-x =äEWW의 문자 에 대해 다음 결과를 제공합니다.

EWW의 범인에 대한 정보

(여기에서는 타밀어 문자가 일반 라틴 문자로 렌더링되므로 여기에 정보를 복사하여 붙여넣을 수 없습니다.)

Firefox나 EWW에서 올바르게 렌더링되지 않는 문자를 일반 Emacs 텍스트 파일에 복사하면 올바르게 렌더링됩니다. 저는 이렇게 살아왔습니다 :)

HTTPS 사이트에서도 이 문제를 관찰했습니다. 예를 들어Wikipedia의 이 사이트올바르게 렌더링되지 않습니다.

new가장 흥미로운 점 중 하나는 ASCII가 아닌 문자가 포함된 파일을 만들었다는 것입니다 . Emacs는 파일을 올바르게 렌더링하지만 Firefox는 문자를 표시합니다 ä. 출력 file new:

new: UTF-8 Unicode text, with no line terminators

답변1

@Gilles가 의견에서 지적했듯이 이는 글꼴 문제입니다. C-u C-x =잘못 렌더링된 문자와 올바르게 렌더링된 문자를 사용해 보았습니다 ä.

유일한 차이점은 다음 줄입니다.

올바르게 렌더링된 캐릭터의 경우:

xft:-paratype-PT Mono-normal-normal-normal-*-17-*-*-*-m-0-iso10646-1 (#xA5)

잘못 렌더링된 문자의 경우:

질문의 세 번째 그림의 마지막 줄을 참조하세요.

보시다시피, 어떤 이유로 Emacs와 Firefox는 Tamil 글꼴인 TSCU_Paranar 글꼴을 사용합니다. 이 글꼴을 제거하고 기본 글꼴을 모든 라틴 문자를 지원하는 글꼴로 변경했습니다.

이것이 문제를 해결했습니다

관련 정보