fb2 책에서 목차를 추출하는 방법은 무엇입니까?

Question 1

사용 xmlstarlet:

xmlstarlet select --template \
    --value-of '//_:section/_:title/_:p | //_:subtitle' \
    -nl file.xml

또는 짧은 옵션을 사용하세요.

xmlstarlet sel -t \
    -v '//_:section/_:title/_:p | //_:subtitle' \
    -n file.xml

여기에 사용된 XPath 쿼리는 아래 각 노드의 값 p뿐만 아니라 모든 노드의 값도 추출합니다.titlesectionsubtitle

표현식에서 각 노드 이름 앞의 접두사는 _:문서에서 사용되는 네임스페이스 식별자에 대한 익명 자리 표시자입니다.

예제 문서에 따르면 위 두 명령 중 하나의 출력은 다음과 같습니다.

Part 1
Some name of Part 1
Chapter 1
Some name of Chapter 1
Episode 1
Episode 2
Part 2
Some name of Part 2
Chapter 3
Some name of Chapter 3
Episode 3
Episode 4

책 제목도 원하시나요? 그런 다음 _:section표현식에서 제한 사항을 제거하세요(이렇게 하면 p책 제목에 대한 노드도 일치하게 됩니다).

좀 더 깔끔하게 보일 수 있는(책 제목 제외) 각 섹션의 제목과 부제를 얻는 또 다른 방법(부제목이 어디에서가 아니라 섹션에서 선택되었음을 표시하기 때문)은 먼저 일치 항목을 부품으로 제한하는 것입니다. 그런 다음 해당 부분에서 데이터를 가져옵니다.

xmlstarlet select --template \
    --match '//_:section' \
    --value-of '_:title/_:p | _:subtitle' \
    -nl file.xml

Answer

사용 xmlstarlet:

xmlstarlet select --template \
    --value-of '//_:section/_:title/_:p | //_:subtitle' \
    -nl file.xml

또는 짧은 옵션을 사용하세요.

xmlstarlet sel -t \
    -v '//_:section/_:title/_:p | //_:subtitle' \
    -n file.xml

여기에 사용된 XPath 쿼리는 아래 각 노드의 값 p뿐만 아니라 모든 노드의 값도 추출합니다.titlesectionsubtitle

표현식에서 각 노드 이름 앞의 접두사는 _:문서에서 사용되는 네임스페이스 식별자에 대한 익명 자리 표시자입니다.

예제 문서에 따르면 위 두 명령 중 하나의 출력은 다음과 같습니다.

Part 1
Some name of Part 1
Chapter 1
Some name of Chapter 1
Episode 1
Episode 2
Part 2
Some name of Part 2
Chapter 3
Some name of Chapter 3
Episode 3
Episode 4

책 제목도 원하시나요? 그런 다음 _:section표현식에서 제한 사항을 제거하세요(이렇게 하면 p책 제목에 대한 노드도 일치하게 됩니다).

좀 더 깔끔하게 보일 수 있는(책 제목 제외) 각 섹션의 제목과 부제를 얻는 또 다른 방법(부제목이 어디에서가 아니라 섹션에서 선택되었음을 표시하기 때문)은 먼저 일치 항목을 부품으로 제한하는 것입니다. 그런 다음 해당 부분에서 데이터를 가져옵니다.

xmlstarlet select --template \
    --match '//_:section' \
    --value-of '_:title/_:p | _:subtitle' \
    -nl file.xml

Question 2

와XPath3인식 FOSS(GPLv3) 명령줄 도구,xidel:

XPath2 빌드 순서:

xidel -e '(//section/title/p, //subtitle)'  file.xml

XPath1:

xidel -e '//section/title/p | //subtitle'  file.xml

Part 1
Some name of Part 1
Chapter 1
Some name of Chapter 1
Episode 1
Episode 2
Part 2
Some name of Part 2
Chapter 3
Some name of Chapter 3
Episode 3
Episode 4

xidelXML/HTML/JSON을 쿼리하는 스위스 군용 칼입니다. namespace자체적으로 기본 설정을 관리 할 수 있을 만큼 똑똑합니다 .

Answer