bash
병합하는 간단한 스크립트를 작성했습니다.N받아쓰기:
#! /bin/bash
file_out="res.dict"
start_time=$(date +%s)
count_overall_before=0
while read -rep file in "$@"
do
count_in_file=$(wc -l $file | grep -o -P "^\d+")
echo "$count_in_file lines in $file"
let count_overall_before+=count_in_file
done
echo "Lines count before: $count_overall_before"
sort -u "$@" > $file_out
count_overall_after=$(wc -l $file_out | grep -o -P "^\d+")
time_in_seconds=$(($(date +%s)-start_time))
echo "Lines count after: $count_overall_after"
echo "Duplicate lines count: $((count_overall_before-count_overall_after))"
echo "Seconds estimated: $time_in_seconds"
사전이 포함된 폴더가 있습니다.
$ ls -l PsycOPacK/Base\ Dictionnaries/
total 8260
-rw-r--r-- 1 russich555 russich555 61288 авг 14 2011 actor-givenname
-rw-r--r-- 1 russich555 russich555 223347 авг 14 2011 actor-names
-rw-r--r-- 1 russich555 russich555 146891 авг 14 2011 actor-surname
-rw-r--r-- 1 russich555 russich555 593687 авг 14 2011 att800
-rw-r--r-- 1 russich555 russich555 152 авг 14 2011 computer-companies
-rw-r--r-- 1 russich555 russich555 26211 авг 14 2011 ComputerSoftandHardwareBrand
-rw-r--r-- 1 russich555 russich555 2409 авг 14 2011 dogs
-rw-r--r-- 1 russich555 russich555 18866 авг 14 2011 drugs
-rw-r--r-- 1 russich555 russich555 755065 авг 14 2011 english
-rw-r--r-- 1 russich555 russich555 311251 авг 14 2011 etc_hosts
-rw-r--r-- 1 russich555 russich555 106743 авг 14 2011 family-names
-rw-r--r-- 1 russich555 russich555 4518 авг 14 2011 famous_people
-rw-r--r-- 1 russich555 russich555 70852 авг 14 2011 female-names
-rw-r--r-- 1 russich555 russich555 3187771 авг 14 2011 french
-rw-r--r-- 1 russich555 russich555 11332 авг 14 2011 french-names
-rw-r--r-- 1 russich555 russich555 78190 авг 14 2011 given-names
-rw-r--r-- 1 russich555 russich555 3077 авг 14 2011 internet-domains
-rw-r--r-- 1 russich555 russich555 87507 авг 14 2011 jargon
-rw-r--r-- 1 russich555 russich555 73635 авг 14 2011 junk
-rw-r--r-- 1 russich555 russich555 353216 авг 14 2011 machine_names
-rw-r--r-- 1 russich555 russich555 46923 авг 14 2011 male-names
-rw-r--r-- 1 russich555 russich555 199597 авг 14 2011 movie-characters
-rw-r--r-- 1 russich555 russich555 296977 авг 14 2011 movie-general
-rw-r--r-- 1 russich555 russich555 101854 авг 14 2011 music-rock
-rw-r--r-- 1 russich555 russich555 11401 авг 14 2011 myths-legends
-rw-r--r-- 1 russich555 russich555 6885 авг 14 2011 places
-rw-r--r-- 1 russich555 russich555 176855 авг 14 2011 pocket-dic
-rw-r--r-- 1 russich555 russich555 101854 авг 14 2011 rock
-rw-r--r-- 1 russich555 russich555 167425 авг 14 2011 rock-groups
-rw-r--r-- 1 russich555 russich555 7350 авг 14 2011 science_fiction
-rw-r--r-- 1 russich555 russich555 14804 авг 14 2011 shows
-rw-r--r-- 1 russich555 russich555 9355 авг 14 2011 special_english
-rw-r--r-- 1 russich555 russich555 3946 авг 14 2011 sports
-rw-r--r-- 1 russich555 russich555 1677 авг 16 2011 SportsTeamsCaps.txt
-rw-r--r-- 1 russich555 russich555 1677 авг 16 2011 SportsTeamsLower.txt
-rw-r--r-- 1 russich555 russich555 1677 авг 16 2011 SportsTeamsUpper.txt
-rw-r--r-- 1 russich555 russich555 91426 авг 14 2011 surnames
-rw-r--r-- 1 russich555 russich555 1677 авг 16 2011 teams
-rw-r--r-- 1 russich555 russich555 58000 авг 14 2011 tech
-rw-r--r-- 1 russich555 russich555 63178 авг 14 2011 technical_dictionary
-rw-r--r-- 1 russich555 russich555 12598 авг 14 2011 unix
-rw-r--r-- 1 russich555 russich555 206403 авг 14 2011 Unix.dict
-rw-r--r-- 1 russich555 russich555 206403 авг 14 2011 unix-words
-rw-r--r-- 1 russich555 russich555 13422 авг 14 2011 us-counties
-rw-r--r-- 1 russich555 russich555 222742 авг 14 2011 words-english
-rw-r--r-- 1 russich555 russich555 222349 авг 14 2011 world_factbook
\
백슬래시가 포함된 디렉터리 경로를 보는 방법약어그 뒤에 있는 공간. 내 목표는 다음과 같이 사전에 인수로 극소수의 경로를 전달할 수 있는 것입니다.
$ ./scripts/merge_dicts.sh dict_1 dict_2
그리고반품이런 식으로 작동하게 만드세요(포장 풀기목차):
./scripts/merge_dicts.sh dicts_folder/*
하지만 경로에 공백이 포함되어 있으면 *
마지막에 실행할 수 없습니다.
$ ./scripts/merge_dicts.sh PsycOPacK/Base\ Dictionnaries/*
wc: PsycOPacK/Base: No such file or directory
wc: Dictionnaries/actor-givenname: No such file or directory
0 lines in PsycOPacK/Base Dictionnaries/actor-givenname
wc: PsycOPacK/Base: No such file or directory
나는 그것에 관한 몇 가지 주제를 빨간색으로 지정했지만 올바른 해결책을 찾지 못했습니다. 모든 매개변수를 한 줄로 읽을 수 있는지 잘 모르겠습니다.
또한 시도했습니다:
for file in "$@"
while file line in "$@"
while file -r line in "$@"
답변1
변수를 참조할 때 큰따옴표( wc "$line"
)를 사용하면 해당 값에 공백이 포함된 경우에도 변수가 매개변수로 확장됩니다.
이 간단한 패턴을 따르면 사용 사례에서 공백에 대해 걱정할 필요가 없습니다. 한편으로는 *
파일당 하나씩 여러 매개 변수로 확장됩니다(공백이 포함된 파일 이름도 포함)."$@"
위치 인수에 해당합니다(공백이 포함된 매개 변수도 포함). .
그러나 예제 스크립트는 여러 가지 다른 방식으로도 손상되었습니다.
- 변수를 사용
$file
하지만 정의하지는 않습니다$line
. while ... in
bash 구성을 사용하지 마세요.for ... in
최소한의 작업 예제로 다음을 가질 수 있습니다.merge_dicts.sh
#!/bin/bash
for filename in "$@"; do
wc -l "$filename"
done
그 다음에
$ ./merge_dicts.sh PsycOPacK/Base\ Dictionnaries/*
0 PsycOPacK/Base Dictionnaries/first file.txt
0 PsycOPacK/Base Dictionnaries/second file.txt