![자막의 :<i> 코드는 무엇을 의미하나요?](https://linux55.com/image/86008/%EC%9E%90%EB%A7%89%EC%9D%98%20%3A%26lt%3Bi%26gt%3B%20%EC%BD%94%EB%93%9C%EB%8A%94%20%EB%AC%B4%EC%97%87%EC%9D%84%20%EC%9D%98%EB%AF%B8%ED%95%98%EB%82%98%EC%9A%94%3F.png)
하위 장면에서 자막을 다운로드했습니다.http://subscene.com/subtitles/the-5th-wave/english/1298314여기에는 내 플레이어 mpv에서 디코딩되지 않는 :<i>
및 같은 일부 인코딩이 포함되어 있습니다 . </i>
보시다시피 자막은 .srt(Subrip Text) 형식입니다.
https://matroska.org/technical/specs/subtitles/srt.html
다음은 이해가 될 수 있도록 완전한 대화입니다.
28
00:03:37,080 --> 00:03:39,280
CASSIE:<i> I miss the Cassie I was.</i>
게임 플레이 중에 코드가 보이지 않도록 수정하고 싶은데 어떻게 수정해야 할지 모르겠습니다. 누구든지 도울 수 있습니까? 데비안에서 테스트 중이고 mpv를 사용하고 있습니다.
[$] mpv --version
(null) requires an argument
mpv 0.14.0 (C) 2000-2015 mpv/MPlayer/mplayer2 projects
built on UNKNOWN
ffmpeg library versions:
libavutil 54.31.100
libavcodec 56.60.100
libavformat 56.40.101
libswscale 3.1.101
libavfilter 5.40.101
libswresample 1.2.101
ffmpeg version: 2.8.6-1+b2
이 문제가 해결되기를 기대합니다. 이 코드는 .srt 파일 전체에 퍼져 있으므로 기껏해야 약간 혼란스럽습니다.
답변1
누군가 자막에 HTML 태그를 사용하고 글꼴을 만들어 보려고 한 것 같습니다.이탤릭체. HTML에 대한 나의 제한된 지식으로 <
표현 기호는 , less than
즉 표현 입니다 . 그래서<
>
>
CASSIE:<i> I miss the Cassie I was.</i>
다음과 같이 시각화할 수 있다.
CASSIE:<i> I miss the Cassie I was.</i>
이탤릭체 코드임을 쉽게 알 수 있습니다. 비디오 플레이어는 html 태그를 인식하지 못합니다. 나는 그것들이 선택된 sed/awk 조합으로 제거될 수 있다고 확신합니다.
sed 's/\<\;i\>\;//; s+\<\;/i\>\;++' somefile.srt >somefile-nohtml.srt