쉘 리눅스를 사용하여 기존 파일에서 xml 태그를 추가하는 방법

쉘 리눅스를 사용하여 기존 파일에서 xml 태그를 추가하는 방법

xml1.xml

<app>
    <bbb>
        <jjj>test1</jjj>
     </bbb>
     <bbb>   
        <jjj>test2</jjj>
    </bbb>
</app>

xml2.xml

파일 2 xml2.xml

<app>
    <bbb>   
       <jjj>test2</jjj>
    </bbb>
    <bbb>
        <jjj>test3</jjj>
    </bbb>
    <bbb>
        <jjj>test4</jjj>
    </bbb>
</app>

2개의 파일을 1개의 파일로 병합할 수 있나요?

<app>
     <bbb>
        <jjj>test1</jjj>
     </bbb>
    <bbb>   
       <jjj>test2</jjj>
    </bbb>
    <bbb>
        <jjj>test3</jjj>
    </bbb>
    <bbb>
        <jjj>test4</jjj>
    </bbb>
</app>

답변1

에서 적응https://stackoverflow.com/questions/10163675/merge-xml-files-in-php

$doc1 = new DOMDocument();
$doc1->load('xml1.xml');

$doc2 = new DOMDocument();
$doc2->load('xml2.xml');

// get 'app' element of document 1
$app1 = $doc1->getElementsByTagName('app')->item(0);

// iterate over 'bbb' elements of document 2
$items2 = $doc2->getElementsByTagName('bbb');
for ($i = 0; $i < $items2->length; $i ++) {
    $item2 = $items2->item($i);

    // import/copy item from document 2 to document 1
    $item1 = $doc1->importNode($item2, true);

    // append imported item to document 1 'app' element
    $app1 ->appendChild($item1);

}
$doc1->save('merged.xml');

답변2

당신이 만들 수 있을 것 같습니다병합 sort그리고 다듬어주세요. 기본적으로 sort자신이 수행 중인 작업을 알고 있다고 가정하고 두 개 이상의 입력에 대해 패스를 실행하여 사전 정렬 순서가 수렴될 때 입력을 인터리브합니다.

귀하의 예에 대해 GNU -merge가 인쇄하는 내용은 다음과 같습니다 .sort


<app>
<app>
    <bbb>
    <bbb>
        <jjj>test1</jjj>
     </bbb>
     <bbb>
       <jjj>test2</jjj>
    </bbb>
    <bbb>
        <jjj>test2</jjj>
    </bbb>
</app>
        <jjj>test3</jjj>
    </bbb>
    <bbb>
        <jjj>test4</jjj>
    </bbb>
</app>

그러니 적어도 지금은 다 접혀 있지만 말씀드린 것처럼 아직 다듬어야 합니다. 이 sed스크립트는 귀하의 예에 대해 다음을 수행합니다.

sort    -m      /tmp/xml[12]                    |
sed     -ne:n   -e'$!s|/a..> *$|bbb>|;$p'       \
                -e'\|^[^>]*b.*\n|{N;P;D;}'      \
-eN     -e's|\(.*\)\n\(.*\n\)* *\1 *$|\1|'      \
        -e's|\n|&|3;tD' -ebn -e:D -eP\;D

입력 시 최소 3개 행을 쌓고 첫 번째 행이 레이블이 아닌 경우 스택의 첫 번째 행을 마지막 행과 비교합니다 <bbb>.


<app>
    <bbb>
        <jjj>test1</jjj>
     </bbb>
     <bbb>   
       <jjj>test2</jjj>
    </bbb>
<bbb>
        <jjj>test3</jjj>
    </bbb>
    <bbb>
        <jjj>test4</jjj>
    </bbb>
</app>

답변3

"쉘" Linux를 사용할 수 없습니다. XML을 처리하려면진짜XML 파서가 필요합니다.

그러나 옵션이 있는 스크립팅 도구는 많이 있습니다. 제가 개인적으로 가장 좋아하는 perl것은XML::Twig도서관. (이것은 "핵심"의 일부는 아니지만 Unix 패키지 관리자에서 매우 일반적입니다.)

#!/usr/bin/env perl

use strict;
use warnings;

use XML::Twig;

#load both
my $first  = XML::Twig->new->parsefile('xml1.xml');
my $second = XML::Twig->new->parsefile('xml2.xml');

#iterate bbb elements in second file
foreach my $bbb ( $second->get_xpath('//bbb') ) {

    #extract 'text' of jjj element (of this bbb element)
    my $jjj = $bbb->first_child_text('jjj');

    #use xpath query to check it doesn't exist first.
    if ( not $first->get_xpath("//bbb/jjj[string()='$jjj']") ) {
        print $jjj, " not in first, splicing\n";

        #cut/paste (note -  done in memory, so original file isn't altered)
        $bbb->move( 'last_child', $first->root );
    }
}

#set output formatting - can do some odd things with particularly strange XMl.
$first->set_pretty_print('indented_a');
$first->print;

## if you want to save it:
open( my $output, '>', "combined.xml" ) or die $!;
print {$output} $first->sprint;
close($output);

관련 정보