쉘스크립트는 HTML 파일에서 특정 태그를 제거합니다.

Question 1

sed/grep과 같은 텍스트 처리 도구를 사용하는 대신 HTML을 이해하는 도구를 사용하십시오.

예를 들어,xsh, 당신은 할 수 있습니다

open :F html file.html ;
delete //tr[td='TESTCASE-002'] ;
save :b ;

그러나 먼저 파일을 복구해야 합니다. 위치가 잘못된 태그 </body>와 </head>닫는 태그를 제거하세요.

Answer

sed/grep과 같은 텍스트 처리 도구를 사용하는 대신 HTML을 이해하는 도구를 사용하십시오.

예를 들어,xsh, 당신은 할 수 있습니다

open :F html file.html ;
delete //tr[td='TESTCASE-002'] ;
save :b ;

그러나 먼저 파일을 복구해야 합니다. 위치가 잘못된 태그 </body>와 </head>닫는 태그를 제거하세요.

Question 2

다음 명령을 사용하여 태그를 제거할 수 있습니다.XSL 변환(XSLT).

xsltproc대부분의 배포판은 명령(패키지의 일부 ) 과 함께 제공되어야 합니다 libxslt.

다음은 쉘 스크립트에서 사용할 수 있는 변환을 수행하는 명령입니다.

xsltproc --html main.xslt index.html

제거될 XSLT입니다.테스트케이스-002:

<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
  <xsl:output omit-xml-declaration="yes"/>
  <xsl:template match="node()|@*">
    <xsl:copy>
      <xsl:apply-templates select="node()|@*"/>
    </xsl:copy>
  </xsl:template>
  <xsl:template match="tr[td = 'TESTCASE-002']"/>
</xsl:stylesheet>

이 접근 방식의 장점은 선언적이고 재사용이 가능하며 XML/HTML을 처리하는 코드를 쉘 스크립트의 나머지 부분과 분리한다는 것입니다. 또한 유연하고 강력합니다. 단점은 내용이 좀 길고 번거롭다는 점입니다.

이 방법은 잘못된 HTML도 처리할 수 있습니다.

Answer