다음 데이터가 포함된 2개의 파일이 있습니다.
파일 1
22:50:48] Return_M
22:50:49] Return_A
22:50:50] Return_F
22:50:51] Return_K
22:50:52] Return_Y
파일 2
22:50:48] <0> X led_required
22:50:48] <0> X start_rules
22:50:48] <0> X leadstart
22:50:49] <0> X asynchronous_start
22:50:49] <0> X controldown
22:50:49] <0> X select_set(3)
22:50:49] <0> X limiting_rules
22:50:50] <0> X stock_manager
22:50:50] <0> X led_blink
22:50:50] <0> X start_required
22:50:51] <0> X control_down
22:50:51] <0> X select_set(3)
22:50:51] <0> X start_rules
22:50:52] <0> X stock_manager
22:50:52] <0> X blink_led
다음을 출력하는 파일을 원합니다.
22:50:48] Return_M <0> X led_required
22:50:48] Return_M <0> X start_rules
22:50:48] Return_M <0> X leadstart
22:50:49] Return_A <0> X asynchronous_start
22:50:49] Return_A <0> X controldown
22:50:49] Return_A <0> X select_set(3)
22:50:49] Return_A <0> X limiting_rules
22:50:50] Return_F <0> X stock_manager
22:50:50] Return_F <0> X led_blink
22:50:50] Return_F <0> X start_required
22:50:51] Return_K <0> X control_down
22:50:51] Return_K <0> X select_set(3)
22:50:51] Return_K <0> X start_rules
22:50:52] Return_Y <0> X stock_manager
22:50:52] Return_Y <0> X blink_led
기본적으로 파일 1의 반환 코드를 파일 2에 넣지만 일치하는 시간에만 넣습니다.
답변1
원하는 작업을 수행하는 두 가지(약간 다른) 스크립트, 즉 Python 스크립트와 Bash 스크립트를 포함했습니다.
파이썬 솔루션
#!/usr/bin/env python3
# -*- encoding: utf-8 -*-
"""prefix_join.py"""
import sys
input_1 = sys.argv[1]
input_2 = sys.argv[2]
# Initialize a list to store prefixes as they occur
prefix_list = list()
# Parse the first input file
data_1 = dict()
with open(input_1, "r") as file_1:
for line in file_1:
# Remove trailing and leading whitespace
line = line.strip()
# Split the string on the first whitespace character
prefix, sep, suffix = line.partition(" ")
# Add the prefix the list of prefixes
if prefix not in prefix_list:
prefix_list.append(prefix)
# Add the prefix to the first data dictionary
if prefix not in data_1:
data_1[prefix] = list()
# Add the suffix to the data dictionary
data_1[prefix].append(suffix)
# Parse the second input file
data_2 = dict()
with open(input_2, "r") as file_2:
for line in file_2:
# Remove trailing and leading whitespace
line = line.strip()
# Split the string on the first whitespace character
prefix, sep, suffix = line.partition(" ")
# Add the prefix the list of prefixes
if prefix not in prefix_list:
prefix_list.append(prefix)
# Add the prefix to the first data dictionary
if prefix not in data_2:
data_2[prefix] = list()
# Add the suffix to the data dictionary
data_2[prefix].append(suffix)
# Output the joined data
for prefix in prefix_list:
for value_1 in data_1.get(prefix, list()):
for value_2 in data_2.get(prefix, list()):
output_line = "{} {} X {}".format(prefix, value_1, value_2)
print(output_line)
다음과 같이 실행할 수 있습니다.
python prefix_join.py file-1.txt file-2.txt
예제 데이터에서는 다음과 같은 출력이 생성됩니다.
22:50:48] Return_M X <0> X led_required
22:50:48] Return_M X <0> X start_rules
22:50:48] Return_M X <0> X leadstart
22:50:49] Return_A X <0> X asynchronous_start
22:50:49] Return_A X <0> X controldown
22:50:49] Return_A X <0> X select_set(3)
22:50:49] Return_A X <0> X limiting_rules
22:50:50] Return_F X <0> X stock_manager
22:50:50] Return_F X <0> X led_blink
22:50:50] Return_F X <0> X start_required
22:50:51] Return_K X <0> X control_down
22:50:51] Return_K X <0> X select_set(3)
22:50:51] Return_K X <0> X start_rules
22:50:52] Return_Y X <0> X stock_manager
22:50:52] Return_Y X <0> X blink_led
쿵쿵 솔루션
#!/usr/bin/env bash
# prefix-join.sh
# Get the input files as command-line arguments
input_file_1="$1"
input_file_2="$2"
# Set the internal field separator to be a newline (don't include spaces or tabs)
IFS=$'\n'
# Iterate over the lines of the first input file
for line_1 in $(cat "${input_file_1}"); do
# Split the line on the first space
prefix_1="${line_1/ */}";
suffix_1="${line_1#*] }";
# Iterate over the lines of the second input file
for line_2 in $(cat "${input_file_2}"); do
# Split the line on the first space
prefix_2="${line_2/ */}";
suffix_2="${line_2#*] }";
# If the prefixes agree, combine the suffixes and output the result
if [[ "${prefix_1}" = "${prefix_2}" ]]; then
echo "${prefix_1} ${suffix_1} X ${suffix_2}"
fi
done
done
다음과 같이 실행할 수 있습니다.
bash prefix-join.sh file-1.txt file-2.txt
샘플 데이터의 경우 Python 스크립트와 동일한 출력이 생성됩니다.
답변2
나는 다음 명령으로 그것을했다
주문하다
for ((i=1;i<=5;i++)); do j=`awk -v i="$i" 'NR==i{print $1}' g1.txt`;k=`awk -v i="$i" 'NR==i{print $NF}' g1.txt`;awk -v j="$j" -v k="$k" '$1==j{print $1,k,$2,$3,$4}' g2.txt;done
산출
for ((i=1;i<=5;i++)); do j=`awk -v i="$i" 'NR==i{print $1}' g1.txt`;k=`awk -v i="$i" 'NR==i{print $NF}' g1.txt`;awk -v j="$j" -v k="$k" '$1==j{print $1,k,$2,$3,$4}' g2.txt;done
22:50:48] Return_M <0> X led_required
22:50:48] Return_M <0> X start_rules
22:50:48] Return_M <0> X leadstart
22:50:49] Return_A <0> X asynchronous_start
22:50:49] Return_A <0> X controldown
22:50:49] Return_A <0> X select_set(3)
22:50:49] Return_A <0> X limiting_rules
22:50:50] Return_F <0> X stock_manager
22:50:50] Return_F <0> X led_blink
22:50:50] Return_F <0> X start_required
22:50:51] Return_K <0> X control_down
22:50:51] Return_K <0> X select_set(3)
22:50:51] Return_K <0> X start_rules
22:50:52] Return_Y <0> X stock_manager
22:50:52] Return_Y <0> X blink_led
답변3
참고: 이 동영상은 재방송입니다.아까 드린 답변은(새로운 질문에 관해서는 이 새로운 질문을 놓쳤습니다.)
두 파일이 정렬되었다고 가정하면 다음과 같습니다.
$ join file1 file2
22:50:48] Return_M <0> X led_required
22:50:48] Return_M <0> X start_rules
22:50:48] Return_M <0> X leadstart
22:50:49] Return_A <0> X asynchronous_start
22:50:49] Return_A <0> X controldown
22:50:49] Return_A <0> X select_set(3)
22:50:49] Return_A <0> X limiting_rules
22:50:50] Return_F <0> X stock_manager
22:50:50] Return_F <0> X led_blink
22:50:50] Return_F <0> X start_required
22:50:51] Return_K <0> X control_down
22:50:51] Return_K <0> X select_set(3)
22:50:51] Return_K <0> X start_rules
22:50:52] Return_Y <0> X stock_manager
22:50:52] Return_Y <0> X blink_led
이 join
유틸리티는관계형 INNER JOIN 연산두 개의 입력 파일에 대해. 기본적으로 첫 번째 열은 조인 열입니다.필요이 열을 정렬하세요.
새로운 질문과 비교했을 때 이 질문의 또 다른 점은 열의 순서에 주의를 기울이는 것입니다. 기본적으로 join
조인 열은 항상 먼저 배치되고, 첫 번째 파일의 모든 열, 두 번째 파일의 모든 열이 배치됩니다.
-o
플래그를 사용하여 이 순서를 변경할 수 있습니다 join
(설명서 참조).