sed 명령을 사용하여 XML 요소 사이의 단어 읽기

Question 1

XML을 올바른 형식의 문서로 만들기 위해 편집해야 했습니다(요소 추가 <root/>및 네임스페이스 선언).

<?xml version="1.0"?>
<root xmlns:ns1="urn:ns1" xmlns:ns2="urn:ns2" xmlns:ns3="urn:ns3" xmlns:ns4="urn:ns4" xmlns:ns5="urn:ns5" xmlns:nd6="urn:nd6">
  <ns1:account>
    <ns2:name>Corporation</ns2:name>
    <address>
      <StrtNm>NewYork</StrtNm>
      <BldgNb>3</BldgNb>
      <PstCd>230300</PstCd>
      <Ctry>USA</Ctry>
    </address>
  </ns1:account>
  <ns3:details>
    <ns4:accnum>
      <ns5:info>
        <nd6:accnum>1234567</nd6:accnum>
      </ns5:info>
    </ns4:accnum>
  </ns3:details>
</root>

xmlstarlet이 작업이 완료되면 XML 파일을 구문 분석하고 필요한 요소를 정확하게 추출하는 데 사용할 수 있습니다.

xmlstarlet sel -t -v '//nd6:accnum' -n x.xml
1234567

필요한 경우 XPath를 수정하여 더 정확하게 만들 수 있습니다. 예를 들어, /root/ns3:details/ns4:accnum/ns5:info/nd6:accnum이것은 극단적인 선택이 될 것입니다.

해당 기능이 없다면 xmlstarlet설치하는 것을 적극 권장합니다. 시스템이 귀하가 관리하는 시스템이 아닌 경우 작업 중인 모든 프로젝트의 전제 조건으로 만드십시오. sedXML 파일을 사용하고 구문 분석하는 것은 awk단기적으로는 효과가 있을 수 있지만 나중에 기술적 부채가 발생하게 됩니다. 특히 XML 문서의 정확한 레이아웃(공백, 줄 바꿈, 주석 등)을 제어할 수 없는 경우 더욱 그렇습니다.

Answer

XML을 올바른 형식의 문서로 만들기 위해 편집해야 했습니다(요소 추가 <root/>및 네임스페이스 선언).

<?xml version="1.0"?>
<root xmlns:ns1="urn:ns1" xmlns:ns2="urn:ns2" xmlns:ns3="urn:ns3" xmlns:ns4="urn:ns4" xmlns:ns5="urn:ns5" xmlns:nd6="urn:nd6">
  <ns1:account>
    <ns2:name>Corporation</ns2:name>
    <address>
      <StrtNm>NewYork</StrtNm>
      <BldgNb>3</BldgNb>
      <PstCd>230300</PstCd>
      <Ctry>USA</Ctry>
    </address>
  </ns1:account>
  <ns3:details>
    <ns4:accnum>
      <ns5:info>
        <nd6:accnum>1234567</nd6:accnum>
      </ns5:info>
    </ns4:accnum>
  </ns3:details>
</root>

xmlstarlet이 작업이 완료되면 XML 파일을 구문 분석하고 필요한 요소를 정확하게 추출하는 데 사용할 수 있습니다.

xmlstarlet sel -t -v '//nd6:accnum' -n x.xml
1234567

필요한 경우 XPath를 수정하여 더 정확하게 만들 수 있습니다. 예를 들어, /root/ns3:details/ns4:accnum/ns5:info/nd6:accnum이것은 극단적인 선택이 될 것입니다.

해당 기능이 없다면 xmlstarlet설치하는 것을 적극 권장합니다. 시스템이 귀하가 관리하는 시스템이 아닌 경우 작업 중인 모든 프로젝트의 전제 조건으로 만드십시오. sedXML 파일을 사용하고 구문 분석하는 것은 awk단기적으로는 효과가 있을 수 있지만 나중에 기술적 부채가 발생하게 됩니다. 특히 XML 문서의 정확한 레이아웃(공백, 줄 바꿈, 주석 등)을 제어할 수 없는 경우 더욱 그렇습니다.

Question 2

xidel 및 유효한 xml 입력(@roaima 답변 참조)을 사용하여 다음을 수행할 수 있습니다.

xidel   -se  '//nd6:accnum/text()'  file.xml

어디

//nd6:accnum/text()어디에서나 "nd6:accnum" 요소를 찾아 해당 텍스트를 선택하는 데 사용되는 XPath 표현식입니다.

Answer

xidel 및 유효한 xml 입력(@roaima 답변 참조)을 사용하여 다음을 수행할 수 있습니다.

xidel   -se  '//nd6:accnum/text()'  file.xml

어디

//nd6:accnum/text()어디에서나 "nd6:accnum" 요소를 찾아 해당 텍스트를 선택하는 데 사용되는 XPath 표현식입니다.

Question 3

이 한 줄짜리 Perl 명령은 예상된 결과를 인쇄합니다.

perl -lne 'print "$1" if /<nd6:accnum>(\w+)</' file.xml
1234567

Answer

이 한 줄짜리 Perl 명령은 예상된 결과를 인쇄합니다.

perl -lne 'print "$1" if /<nd6:accnum>(\w+)</' file.xml
1234567

sed 명령을 사용하여 XML 요소 사이의 단어 읽기

답변1

답변2

답변3

관련 정보