여러 번 추출하고 첫 번째 XML 태그 제거

Question 1

XML 파서를 사용하는 것은 XML 문서를 조작하는 올바른 방법입니다.

xmlstarlet sel -t -c '//capacity[1]' -n yourxml > temp.txt 
&& xmlstarlet ed -d '//capacity[1]' yourxml > tmp.xml && mv tmp.xml yourxml

cat temp.txt
<capacity><name>45.90</name>
<index>0</index>
<value_type>String</value_type>
<ignore_case_flag>1</ignore_case_flag>
<hidden_flag>0</hidden_flag>
<exclude_from_parse_flag>1</exclude_from_parse_flag>
</capacity>

xmlstarlet sel -t -c '//capacity[1]' -n yourxml > temp.txt- 첫 번째 capacity태그 선언을 추출하고 출력을 다음으로 리디렉션합니다.temp.txt
xmlstarlet ed -d '//capacity[1]' yourxml > tmp.xmlcapacity-문서에서 첫 번째 태그를 제거하고( -d삭제 작업을 통해) 수정된 문서 내용을 임시 파일로 리디렉션합니다.tmp.xml
mv tmp.xml yourxml- 초기 XML 문서를 수정된 버전으로 교체

Answer

XML 파서를 사용하는 것은 XML 문서를 조작하는 올바른 방법입니다.

xmlstarlet해결책:

xmlstarlet sel -t -c '//capacity[1]' -n yourxml > temp.txt 
&& xmlstarlet ed -d '//capacity[1]' yourxml > tmp.xml && mv tmp.xml yourxml

cat temp.txt
<capacity><name>45.90</name>
<index>0</index>
<value_type>String</value_type>
<ignore_case_flag>1</ignore_case_flag>
<hidden_flag>0</hidden_flag>
<exclude_from_parse_flag>1</exclude_from_parse_flag>
</capacity>

xmlstarlet sel -t -c '//capacity[1]' -n yourxml > temp.txt- 첫 번째 capacity태그 선언을 추출하고 출력을 다음으로 리디렉션합니다.temp.txt
xmlstarlet ed -d '//capacity[1]' yourxml > tmp.xmlcapacity-문서에서 첫 번째 태그를 제거하고( -d삭제 작업을 통해) 수정된 문서 내용을 임시 파일로 리디렉션합니다.tmp.xml
mv tmp.xml yourxml- 초기 XML 문서를 수정된 버전으로 교체

Question 2

XML 파서가 없으므로 gnu awk로 이것을 시도해 보십시오:

$ awk -v RS="<subcolumns>|</capacity>" 'NR==2{gsub(/^\n/,"");print $0 RT;exit}' file.xml
<capacity><name>45.90</name>
<index>0</index>
<value_type>String</value_type>
<ignore_case_flag>1</ignore_case_flag>
<hidden_flag>0</hidden_flag>
<exclude_from_parse_flag>1</exclude_from_parse_flag>
</capacity>

이것이 작동하는 이유:
awk에서는 사용자 정의 레코드/줄 구분 기호를 설정할 수 있습니다. 이 예에서는 <subcolumns>또는</capacity>

따라서 레코드 구분 기호를 사용자 정의하면 다음 형식을 얻을 수 있습니다.

$ awk -v RS="<subcolumns>|</capacity>" '{gsub(/^\n/,"");print NR,$0 RT}' file.xml
1 <subcolumns>
2 <capacity><name>45.90</name>
<index>0</index>
<value_type>String</value_type>
<ignore_case_flag>1</ignore_case_flag>
<hidden_flag>0</hidden_flag>
<exclude_from_parse_flag>1</exclude_from_parse_flag>
</capacity>
3 <capacity><name>57.09</name>
<index>1</index>
<value_type>String</value_type>
<ignore_case_flag>1</ignore_case_flag>
<hidden_flag>0</hidden_flag>
<exclude_from_parse_flag>1</exclude_from_parse_flag>
</capacity>
4 <capacity><name>55</name>
<index>2</index>
<value_type>String</value_type>
<ignore_case_flag>1</ignore_case_flag>
<hidden_flag>0</hidden_flag>
<exclude_from_parse_flag>1</exclude_from_parse_flag>
</capacity>
5 </subcolumns>

추신: NR = 숫자 또는 레코드/행. RT=사용할 레코드 구분 기호입니다.

따라서 <capacity></capacity>NR 번호를 조정하여 모든 블록을 인쇄할 수 있습니다.

$ awk -v RS="<subcolumns>|</capacity>" 'NR==4{gsub(/^\n/,"");print $0 RT}'
<capacity><name>55</name>
<index>2</index>
<value_type>String</value_type>
<ignore_case_flag>1</ignore_case_flag>
<hidden_flag>0</hidden_flag>
<exclude_from_parse_flag>1</exclude_from_parse_flag>
</capacity>

따라서 섹션(예: 첫 번째 용량 섹션)을 건너뛰어야 하는 경우 <capacity>다음을 수행할 수 있습니다.

$ awk -v RS="<subcolumns>|</capacity>" '{gsub(/^\n/,"")}NR!=2{print $0 RT}'
<subcolumns>
<capacity><name>57.09</name>
<index>1</index>
<value_type>String</value_type>
<ignore_case_flag>1</ignore_case_flag>
<hidden_flag>0</hidden_flag>
<exclude_from_parse_flag>1</exclude_from_parse_flag>
</capacity>
<capacity><name>55</name>
<index>2</index>
<value_type>String</value_type>
<ignore_case_flag>1</ignore_case_flag>
<hidden_flag>0</hidden_flag>
<exclude_from_parse_flag>1</exclude_from_parse_flag>
</capacity>
</subcolumns>

Answer