대용량(>2GB) XML 파일에서 노드를 제거하는 방법은 무엇입니까?

Question 1

awk를 사용할 수 있습니다.

$cat my.xml | awk '/<b>/{hide=1} /<\/record>/ {hide=0} {if (hide==0) print;}' >mynew.xml

이렇게 하면 포함 라인 이후의 모든 내용이 숨겨지고 <b>포함 라인부터 시작하여 표시됩니다.</record>

귀하의 의견에 따르면 XML이 하나의 큰 줄인 경우 여러 줄로 나누고 변환을 마친 후 개행을 제거하십시오.

$cat my.xml|sed 's/>/>\n/g'| awk ....... | tr -d '\n' >.....

XML을 버리고 YAML 또는 JSON을 사용해 보세요!

Answer

awk를 사용할 수 있습니다.

$cat my.xml | awk '/<b>/{hide=1} /<\/record>/ {hide=0} {if (hide==0) print;}' >mynew.xml

이렇게 하면 포함 라인 이후의 모든 내용이 숨겨지고 <b>포함 라인부터 시작하여 표시됩니다.</record>

귀하의 의견에 따르면 XML이 하나의 큰 줄인 경우 여러 줄로 나누고 변환을 마친 후 개행을 제거하십시오.

$cat my.xml|sed 's/>/>\n/g'| awk ....... | tr -d '\n' >.....

XML을 버리고 YAML 또는 JSON을 사용해 보세요!

Question 2

개인적으로 저는 C(어셈블리 전 가장 낮은 수준)에서 작업을 수행하고 libxml을 사용하여 모든 노드를 반복합니다.

여기 몇 가지 예가 있어요.http://www.xmlsoft.org/examples/

GCC를 사용하여 코드를 컴파일합니다.

Answer

개인적으로 저는 C(어셈블리 전 가장 낮은 수준)에서 작업을 수행하고 libxml을 사용하여 모든 노드를 반복합니다.

여기 몇 가지 예가 있어요.http://www.xmlsoft.org/examples/

GCC를 사용하여 코드를 컴파일합니다.

관련 정보