~ 105 G
나는 많은 내용을 포함하는 매우 큰 텍스트 파일을 가지고 있습니다 <XXXX>
(꺾쇠 괄호는 그 사이의 텍스트를 포함합니다).
그 괄호와 그 사이의 텍스트를 제거하고 싶습니다.
답변1
"sed"는 당신의 친구입니다. 나는 괄호를 포함하고 싶지 않습니다.
주의 깊은! 파일을 덮어쓰게 됩니다.
sed -i 's/<[^>]*>//g' big_file
답변2
XML 파일 및 가용성이 주어지면XML 스타:
$ cat file.xml
<root>
<tag attrib="hello">Hello world</tag>
<tag attrib="nice">Nice to see you</tag>
</root>
$ xmlstarlet sel -t -v / file.xml
Hello world
Nice to see you
이는 XMLStarlet을 사용하여 루트 노드와 모든 하위 노드의 값을 추출합니다.