자막의 :<i> 코드는 무엇을 의미하나요?

자막의 :<i> 코드는 무엇을 의미하나요?

하위 장면에서 자막을 다운로드했습니다.http://subscene.com/subtitles/the-5th-wave/english/1298314여기에는 내 플레이어 mpv에서 디코딩되지 않는 :<i>및 같은 일부 인코딩이 포함되어 있습니다 . </i>보시다시피 자막은 .srt(Subrip Text) 형식입니다.

https://matroska.org/technical/specs/subtitles/srt.html

다음은 이해가 될 수 있도록 완전한 대화입니다.

28
00:03:37,080 --> 00:03:39,280
CASSIE:<i> I miss the Cassie I was.</i>

게임 플레이 중에 코드가 보이지 않도록 수정하고 싶은데 어떻게 수정해야 할지 모르겠습니다. 누구든지 도울 수 있습니까? 데비안에서 테스트 중이고 mpv를 사용하고 있습니다.

[$] mpv --version                                                                                                               
(null) requires an argument
mpv 0.14.0 (C) 2000-2015 mpv/MPlayer/mplayer2 projects
 built on UNKNOWN
ffmpeg library versions:
   libavutil       54.31.100
   libavcodec      56.60.100
   libavformat     56.40.101
   libswscale      3.1.101
   libavfilter     5.40.101
   libswresample   1.2.101
ffmpeg version: 2.8.6-1+b2

이 문제가 해결되기를 기대합니다. 이 코드는 .srt 파일 전체에 퍼져 있으므로 기껏해야 약간 혼란스럽습니다.

답변1

누군가 자막에 HTML 태그를 사용하고 글꼴을 만들어 보려고 한 것 같습니다.이탤릭체. HTML에 대한 나의 제한된 지식으로 &lt;표현 기호는 , less than즉 표현 입니다 . 그래서<&gt;>

CASSIE:&lt;i&gt; I miss the Cassie I was.&lt;/i&gt;

다음과 같이 시각화할 수 있다.

CASSIE:<i> I miss the Cassie I was.</i>

이탤릭체 코드임을 쉽게 알 수 있습니다. 비디오 플레이어는 html 태그를 인식하지 못합니다. 나는 그것들이 선택된 sed/awk 조합으로 제거될 수 있다고 확신합니다.

sed 's/\&lt\;i\&gt\;//; s+\&lt\;/i\&gt\;++' somefile.srt >somefile-nohtml.srt

관련 정보