![HTML 파일의 이상한 HTML 문자 사이에 새 줄을 삽입하는 데 문제가 있습니다 - UTF-8 [닫기]](https://linux55.com/image/105501/HTML%20%ED%8C%8C%EC%9D%BC%EC%9D%98%20%EC%9D%B4%EC%83%81%ED%95%9C%20HTML%20%EB%AC%B8%EC%9E%90%20%EC%82%AC%EC%9D%B4%EC%97%90%20%EC%83%88%20%EC%A4%84%EC%9D%84%20%EC%82%BD%EC%9E%85%ED%95%98%EB%8A%94%20%EB%8D%B0%20%EB%AC%B8%EC%A0%9C%EA%B0%80%20%EC%9E%88%EC%8A%B5%EB%8B%88%EB%8B%A4%20-%20UTF-8%20%5B%EB%8B%AB%EA%B8%B0%5D.png)
다음 명령을 사용하여 텍스트 파일의 문자 사이에 새 줄을 삽입하여 단일 문자 열을 생성합니다.
sed 's/./&\n/g' file.txt
이는 다음과 같은 ASCII 내의 문자에 적용됩니다.
123
도착하다:
1
2
3
Õöþùüê¡£¢¥Ÿ£€Ÿ£¡œãòá碜áòá
HTML로 다운로드한 웹 페이지에 나타나는 멀티바이트 문자(예:)로는 아무 것도 할 수 없습니다 .
어떤 제안이 있으십니까?
이것은 제가 게시한 또 다른 질문에 대해 개발 중인 솔루션의 일부입니다. 궁극적으로 이 문자를 영어로 변환하는 스크립트를 생성하려고 합니다. 하지만 각 문자를 한 줄에 입력해야 합니다.
답변1
어떤 제안이 있으십니까?
첫째, 이것은 나에게 잘 작동합니다.
echo "Õöþùüê¡£¢" | sed 's/./&\n/g'
Õ
ö
þ
ù
ü
ê
¡
£
¢
이것을 감안할 때 locale
:
locale
LANG=sv_SE.UTF-8
LANGUAGE=
LC_CTYPE="sv_SE.UTF-8"
LC_NUMERIC="sv_SE.UTF-8"
LC_TIME="sv_SE.UTF-8"
LC_COLLATE="sv_SE.UTF-8"
LC_MONETARY="sv_SE.UTF-8"
LC_MESSAGES="sv_SE.UTF-8"
LC_PAPER="sv_SE.UTF-8"
LC_NAME="sv_SE.UTF-8"
LC_ADDRESS="sv_SE.UTF-8"
LC_TELEPHONE="sv_SE.UTF-8"
LC_MEASUREMENT="sv_SE.UTF-8"
LC_IDENTIFICATION="sv_SE.UTF-8"
LC_ALL=
내 생각엔 당신이 그런 것 locale
같아요아니요UTF-8. locale
UTF-8로 설정 하고 다시 시도해 보세요.