Perl을 사용하여 xml 파일에서 줄을 변경하고 태그를 제거하시겠습니까?

Question 1

XML을 구문 분석하는 데 정규식을 사용하지 마십시오. 이것은 나쁜 생각입니다. 이것이 나쁜 생각인 주된 이유는 많은 종류의 XML이 있고 의미상 동일한 일부 XML이 상당히 다른 패턴 일치를 가질 수 있다는 것입니다.

개행, 공백, 단항 태그 등을 고려하세요.

<element />
<element></element>

둘 다 동일합니다. 그런 다음 들여쓰기, 줄 바꿈, 태그 분할 등을 수행할 수 있습니다.

<element 
    att1="fish"
    att2="carrot">

또한 유효합니다.

그럼 나도 그럴게강하게"파서 사용"을 권장합니다. Perl에는 다양한 옵션이 있습니다. 제가 좋아하는 것은 다음과 같습니다 XML::Twig.

#!/usr/bin/env perl
use strict;
use warnings;
use XML::Twig;

my $twig = XML::Twig->new( 'pretty_print' => 'indented_a' )->parse( \*DATA );

foreach my $hello ( $twig->findnodes('//hello') ) {
    if ( $hello->trimmed_text =~ m/collect_model/ ) {
        $hello->set_text('collect_model = 0');
    }
}

$_->delete for $twig->findnodes('//derta-config');

$twig->print;

__DATA__
<root>
<world>
    <hello>collect_model = 1</hello>
    <hello>enable_data = 0</hello>
    <hello>session_ms = 2*60*1000</hello>
    <hello>max_collect = string_integer($extract("max_collect"))</hello>
    <hello>max_collect = parenting(max_collect, max_collect, 1.0e99)</hello>
    <hello>output('{')</hello>
</world>
<derta-config>
    <data-users>2000</data-users>
    <test-users>2000</test-users>
    <attributes>hello world</attributes>
    <client-types>Client1</client-types>
    <target>price.world</target>
</derta-config>
</root>

왜냐하면 당신은 Perl에서 다음 줄을 좋아하는 것 같기 때문입니다:

perl -MXML::Twig -0777 -e 'my $twig = XML::Twig->parse (<>); $_->set_text("collect_model = 0") for grep { $_->text =~ m/collect_model/ } $twig->findnodes("//hello"); $_->delete for $twig->findnodes("//derta-config"); $twig -> print;'

Answer

XML을 구문 분석하는 데 정규식을 사용하지 마십시오. 이것은 나쁜 생각입니다. 이것이 나쁜 생각인 주된 이유는 많은 종류의 XML이 있고 의미상 동일한 일부 XML이 상당히 다른 패턴 일치를 가질 수 있다는 것입니다.

개행, 공백, 단항 태그 등을 고려하세요.

<element />
<element></element>

둘 다 동일합니다. 그런 다음 들여쓰기, 줄 바꿈, 태그 분할 등을 수행할 수 있습니다.

<element 
    att1="fish"
    att2="carrot">

또한 유효합니다.

그럼 나도 그럴게강하게"파서 사용"을 권장합니다. Perl에는 다양한 옵션이 있습니다. 제가 좋아하는 것은 다음과 같습니다 XML::Twig.

#!/usr/bin/env perl
use strict;
use warnings;
use XML::Twig;

my $twig = XML::Twig->new( 'pretty_print' => 'indented_a' )->parse( \*DATA );

foreach my $hello ( $twig->findnodes('//hello') ) {
    if ( $hello->trimmed_text =~ m/collect_model/ ) {
        $hello->set_text('collect_model = 0');
    }
}

$_->delete for $twig->findnodes('//derta-config');

$twig->print;

__DATA__
<root>
<world>
    <hello>collect_model = 1</hello>
    <hello>enable_data = 0</hello>
    <hello>session_ms = 2*60*1000</hello>
    <hello>max_collect = string_integer($extract("max_collect"))</hello>
    <hello>max_collect = parenting(max_collect, max_collect, 1.0e99)</hello>
    <hello>output('{')</hello>
</world>
<derta-config>
    <data-users>2000</data-users>
    <test-users>2000</test-users>
    <attributes>hello world</attributes>
    <client-types>Client1</client-types>
    <target>price.world</target>
</derta-config>
</root>

왜냐하면 당신은 Perl에서 다음 줄을 좋아하는 것 같기 때문입니다:

perl -MXML::Twig -0777 -e 'my $twig = XML::Twig->parse (<>); $_->set_text("collect_model = 0") for grep { $_->text =~ m/collect_model/ } $twig->findnodes("//hello"); $_->delete for $twig->findnodes("//derta-config"); $twig -> print;'

Question 2

다음을 예제 입력 파일로 사용하십시오.

$ cat client_23.xml 
<world>
    <hello>collect_model = 1</hello>
    <hello>enable_data = 0</hello>
    <hello>session_ms = 2*60*1000</hello>
    <hello>max_collect = string_integer($extract("max_collect"))</hello>
    <hello>max_collect = parenting(max_collect, max_collect, 1.0e99)</hello>
    <hello>output('{')</hello>
</world>
<derta-config>
    <data-users>2000</data-users>
    <test-users>2000</test-users>
    <attributes>hello world</attributes>
    <client-types>Client1</model-types>
    <target>price.world</target>
</derta-config>

다음을 사용하여 두 가지 변경을 수행할 수 있습니다.

$ sed 's|<hello>collect_model = 1</hello>|<hello>collect_model = 0</hello>|; \|<derta-config>|,\|</derta-config>|d' client_23.xml 
<world>
    <hello>collect_model = 0</hello>
    <hello>enable_data = 0</hello>
    <hello>session_ms = 2*60*1000</hello>
    <hello>max_collect = string_integer($extract("max_collect"))</hello>
    <hello>max_collect = parenting(max_collect, max_collect, 1.0e99)</hello>
    <hello>output('{')</hello>
</world>

어떻게 작동하나요?

두 개의 sed 명령이 있습니다. 첫 번째는 교체이고, 두 번째는 삭제입니다.

s|<hello>collect_model = 1</hello>|<hello>collect_model = 0</hello>|

대체 명령의 형식은 입니다 s|old|new|. 따라서 이것이 old원본 <hello>collect_model = 1</hello>이고 new이것이 대체입니다 <hello>collect_model = 0</hello>.
\|<derta-config>|,\|</derta-config>|d

이는 일련의 행을 정의합니다. 시작 줄에는 가 포함되고 derta-config>, 끝 줄에는 가 포함됩니다 </derta-config>. 이 범위 내의 모든 행은 삭제 명령에 의해 삭제됩니다 d.

Answer

다음을 예제 입력 파일로 사용하십시오.

$ cat client_23.xml 
<world>
    <hello>collect_model = 1</hello>
    <hello>enable_data = 0</hello>
    <hello>session_ms = 2*60*1000</hello>
    <hello>max_collect = string_integer($extract("max_collect"))</hello>
    <hello>max_collect = parenting(max_collect, max_collect, 1.0e99)</hello>
    <hello>output('{')</hello>
</world>
<derta-config>
    <data-users>2000</data-users>
    <test-users>2000</test-users>
    <attributes>hello world</attributes>
    <client-types>Client1</model-types>
    <target>price.world</target>
</derta-config>

다음을 사용하여 두 가지 변경을 수행할 수 있습니다.

$ sed 's|<hello>collect_model = 1</hello>|<hello>collect_model = 0</hello>|; \|<derta-config>|,\|</derta-config>|d' client_23.xml 
<world>
    <hello>collect_model = 0</hello>
    <hello>enable_data = 0</hello>
    <hello>session_ms = 2*60*1000</hello>
    <hello>max_collect = string_integer($extract("max_collect"))</hello>
    <hello>max_collect = parenting(max_collect, max_collect, 1.0e99)</hello>
    <hello>output('{')</hello>
</world>

어떻게 작동하나요?

두 개의 sed 명령이 있습니다. 첫 번째는 교체이고, 두 번째는 삭제입니다.

s|<hello>collect_model = 1</hello>|<hello>collect_model = 0</hello>|

대체 명령의 형식은 입니다 s|old|new|. 따라서 이것이 old원본 <hello>collect_model = 1</hello>이고 new이것이 대체입니다 <hello>collect_model = 0</hello>.
\|<derta-config>|,\|</derta-config>|d

이는 일련의 행을 정의합니다. 시작 줄에는 가 포함되고 derta-config>, 끝 줄에는 가 포함됩니다 </derta-config>. 이 범위 내의 모든 행은 삭제 명령에 의해 삭제됩니다 d.

Perl을 사용하여 xml 파일에서 줄을 변경하고 태그를 제거하시겠습니까?

답변1

답변2

어떻게 작동하나요?

관련 정보