HTML 파일의 이상한 HTML 문자 사이에 새 줄을 삽입하는 데 문제가 있습니다 - UTF-8 [닫기]

HTML 파일의 이상한 HTML 문자 사이에 새 줄을 삽입하는 데 문제가 있습니다 - UTF-8 [닫기]

다음 명령을 사용하여 텍스트 파일의 문자 사이에 새 줄을 삽입하여 단일 문자 열을 생성합니다.

sed 's/./&\n/g' file.txt

이는 다음과 같은 ASCII 내의 문자에 적용됩니다.

123

도착하다:

1

2

3

Õöþùüê¡£¢¥Ÿ£€Ÿ£¡œãòá碜áòáHTML로 다운로드한 웹 페이지에 나타나는 멀티바이트 문자(예:)로는 아무 것도 할 수 없습니다 .

어떤 제안이 있으십니까?

이것은 제가 게시한 또 다른 질문에 대해 개발 중인 솔루션의 일부입니다. 궁극적으로 이 문자를 영어로 변환하는 스크립트를 생성하려고 합니다. 하지만 각 문자를 한 줄에 입력해야 합니다.

답변1

어떤 제안이 있으십니까?

첫째, 이것은 나에게 잘 작동합니다.

echo "Õöþùüê¡£¢" | sed 's/./&\n/g'
Õ
ö
þ
ù
ü
ê
¡
£
¢

이것을 감안할 때 locale:

locale
LANG=sv_SE.UTF-8
LANGUAGE=
LC_CTYPE="sv_SE.UTF-8"
LC_NUMERIC="sv_SE.UTF-8"
LC_TIME="sv_SE.UTF-8"
LC_COLLATE="sv_SE.UTF-8"
LC_MONETARY="sv_SE.UTF-8"
LC_MESSAGES="sv_SE.UTF-8"
LC_PAPER="sv_SE.UTF-8"
LC_NAME="sv_SE.UTF-8"
LC_ADDRESS="sv_SE.UTF-8"
LC_TELEPHONE="sv_SE.UTF-8"
LC_MEASUREMENT="sv_SE.UTF-8"
LC_IDENTIFICATION="sv_SE.UTF-8"
LC_ALL=

내 생각엔 당신이 그런 것 locale같아요아니요UTF-8. localeUTF-8로 설정 하고 다시 시도해 보세요.

관련 정보