![여러 레코드가 포함된 플랫 파일 변환/가져오기(한 줄에 변수 1개)](https://linux55.com/image/69679/%EC%97%AC%EB%9F%AC%20%EB%A0%88%EC%BD%94%EB%93%9C%EA%B0%80%20%ED%8F%AC%ED%95%A8%EB%90%9C%20%ED%94%8C%EB%9E%AB%20%ED%8C%8C%EC%9D%BC%20%EB%B3%80%ED%99%98%2F%EA%B0%80%EC%A0%B8%EC%98%A4%EA%B8%B0(%ED%95%9C%20%EC%A4%84%EC%97%90%20%EB%B3%80%EC%88%98%201%EA%B0%9C).png)
저는 (UNIX) 명령줄 도구를 사용하여 플랫 파일을 (NY) 데이터베이스로 읽는 효율적인 방법을 찾고 있습니다. 아마도 먼저 중간 구조 형식(예: XML 또는 csv)으로 변환한 후일 것입니다. 플랫 파일에는 아래와 같이 각 행에 키와 값이 포함된 여러 레코드가 있습니다. 변수의 수는 레코드마다 다를 수 있으며, 변수의 수와 이름은 입력 파일을 읽은 후에만 알 수 있습니다. (문제를 더 복잡하게 만들기 위해 중복 변수가 중첩될 수 있지만 지금은 무시할 수 있습니다.)
행을 열로 변환하는 방법에 대한 이 사이트의 답변과 기타 답변을 확인했지만 적절한 답변은 없는 것 같습니다. 문제는 INI 또는 VCARD 파일을 읽는 것과 비슷해 보이지만 일반적인 해결책을 찾을 수 없습니다. XSL 변환이 가능할 수도 있지만 아직 찾지 못했습니다. 어떤 조언이라도 매우 환영합니다. 감사합니다.
최종 결과로 정확히 무엇을 원하는지 잘 모르겠지만 다음은 데이터를 XML로 변환하는 Python 스크립트입니다.
#!/usr/bin/env python2
# -*- coding: ascii -*-
Parses a data file contain textual records in the following format:
and converts it to an XML document with record-elements of the following form:
import sys
import re
from xml.etree.ElementTree import Element, SubElement, tostring
from xml.dom.minidom import parseString
# Creat a root element for the XML document
root = Element('root')
# Set a variable to keep track of the current record
current_record = None
# Parse the data and construct an XML representation
with open(sys.argv[1]) as datafile:
# Extract the non-empty lines from the data file
lines = [line.strip() for line in datafile if line.strip()]
# Iterate over the lines
for line in lines:
# Check to see if we've reached a new record
if "RecordUUID" in line:
# Extract the record ID
eid = line.strip()[1:-1]
# Add a new child element to the document
# and update the current record
current_record = SubElement(root, eid)
# Check to see if we've reached a new key-value pair
match = re.match(r'^"(\w+)"="(\w+)"$', line.strip())
# If we have a key-value pair then update the current record
if match:
key, value = match.groups()
SubElement(current_record, key).text = value
# Display the generated XML document
다음 데이터(예: 질문의 예제 데이터)를 다음이라는 파일에 넣으면 data.txt
그런 다음 스크립트를 실행합니다.
user@host:~$ python transform.py data.txt
그러면 다음과 같은 결과가 나옵니다:
<?xml version="1.0" ?>