tree
*nix 명령의 출력을 JSON 형식으로 변환하는 편리한 방법이 있습니까 ? 내 목표는 다음과 같이 변환하는 것입니다.
.
|-- dir1
| |-- dirA
| | |-- dirAA
| | `-- dirBB
| `-- dirB
`-- dir2
|-- dirA
`-- dirB
입력하다:
{"dir1" : [{"dirA":["dirAA", "dirAB"]}, "dirB"], "dir2": ["dirA", "dirB"]}
답변1
버전 1.7에는 JSON에 대한 지원이 포함되어 있습니다.
http://mama.indstate.edu/users/ice/tree/changes.html
페이지당 man
(아래 XML/JSON/HTML OPTIONS
):
-J Turn on JSON output. Outputs the directory tree as an JSON formatted array.
예를 들어
$ tree -J
/home/me/trash/tree-1.7.0
[{"type":"directory","name": ".","contents":[
{"type":"file","name":"CHANGES"},
{"type":"file","name":"color.c"},
{"type":"file","name":"color.o"},
{"type":"directory","name":"doc","contents":[
{"type":"file","name":"tree.1"},
{"type":"file","name":"tree.1.fr"},
{"type":"file","name":"xml.dtd"}
]},
{"type":"file","name":"hash.c"},
{"type":"file","name":"hash.o"},
{"type":"file","name":"html.c"},
{"type":"file","name":"html.o"},
{"type":"file","name":"INSTALL"},
{"type":"file","name":"json.c"},
{"type":"file","name":"json.o"},
{"type":"file","name":"LICENSE"},
{"type":"file","name":"Makefile"},
{"type":"file","name":"README"},
{"type":"file","name":"strverscmp.c"},
{"type":"file","name":"TODO"},
{"type":"file","name":"tree"},
{"type":"file","name":"tree.c"},
{"type":"file","name":"tree.h"},
{"type":"file","name":"tree.o"},
{"type":"file","name":"unix.c"},
{"type":"file","name":"unix.o"},
{"type":"file","name":"xml.c"},
{"type":"file","name":"xml.o"}
]},
{"type":"report","directories":1,"files":26}
]
답변2
1번 시도
해시 구조의 단순 해시를 반환하는 Perl 전용 솔루션입니다. 이전에 OP에서는 JSON의 데이터 형식을 명확히 했습니다.
#! /usr/bin/perl
use File::Find;
use JSON;
use strict;
use warnings;
my $dirs={};
my $encoder = JSON->new->ascii->pretty;
find({wanted => \&process_dir, no_chdir => 1 }, ".");
print $encoder->encode($dirs);
sub process_dir {
return if !-d $File::Find::name;
my $ref=\%$dirs;
for(split(/\//, $File::Find::name)) {
$ref->{$_} = {} if(!exists $ref->{$_});
$ref = $ref->{$_};
}
}
File::Find
모듈은 find
유닉스 명령과 유사하게 작동합니다. 이 JSON
모듈은 Perl 변수를 가져와 JSON으로 변환합니다.
find({wanted => \&process_dir, no_chdir => 1 }, ".");
process_dir
현재 작업 디렉토리의 파일 구조를 반복하여 "." 아래의 각 파일/디렉토리에 대한 서브루틴을 호출하고 Perl에게 찾은 각 디렉토리에 대해 를 내보내지 no_chdir
않도록 지시합니다 .chdir()
process_dir
현재 확인 중인 파일이 디렉터리가 아닌 경우 다음을 반환합니다.
return if !-d $File::Find::name;
그런 다음 기존 해시에 대한 참조를 %$dirs
에 넣고 $ref
파일 경로를 분할한 다음 각 경로에 대해 새 해시 키를 추가하여 /
반복합니다 .for
slm과 같은 디렉토리 구조를 만듭니다.
mkdir -p dir{1..5}/dir{A,B}/subdir{1..3}
출력은 다음과 같습니다
{
"." : {
"dir3" : {
"dirA" : {
"subdir2" : {},
"subdir3" : {},
"subdir1" : {}
},
"dirB" : {
"subdir2" : {},
"subdir3" : {},
"subdir1" : {}
}
},
"dir2" : {
"dirA" : {
"subdir2" : {},
"subdir3" : {},
"subdir1" : {}
},
"dirB" : {
"subdir2" : {},
"subdir3" : {},
"subdir1" : {}
}
},
"dir5" : {
"dirA" : {
"subdir2" : {},
"subdir3" : {},
"subdir1" : {}
},
"dirB" : {
"subdir2" : {},
"subdir3" : {},
"subdir1" : {}
}
},
"dir1" : {
"dirA" : {
"subdir2" : {},
"subdir3" : {},
"subdir1" : {}
},
"dirB" : {
"subdir2" : {},
"subdir3" : {},
"subdir1" : {}
}
},
"dir4" : {
"dirA" : {
"subdir2" : {},
"subdir3" : {},
"subdir1" : {}
},
"dirB" : {
"subdir2" : {},
"subdir3" : {},
"subdir1" : {}
}
}
}
}
2번 시도
좋습니다. 이제 다른 데이터 구조를 사용하겠습니다...
#! /usr/bin/perl
use warnings;
use strict;
use JSON;
my $encoder = JSON->new->ascii->pretty; # ascii character set, pretty format
my $dirs; # used to build the data structure
my $path=$ARGV[0] || '.'; # use the command line arg or working dir
# Open the directory, read in the file list, grep out directories and skip '.' and '..'
# and assign to @dirs
opendir(my $dh, $path) or die "can't opendir $path: $!";
my @dirs = grep { ! /^[.]{1,2}/ && -d "$path/$_" } readdir($dh);
closedir($dh);
# recurse the top level sub directories with the parse_dir subroutine, returning
# a hash reference.
%$dirs = map { $_ => parse_dir("$path/$_") } @dirs;
# print out the JSON encoding of this data structure
print $encoder->encode($dirs);
sub parse_dir {
my $path = shift; # the dir we're working on
# get all sub directories (similar to above opendir/readdir calls)
opendir(my $dh, $path) or die "can't opendir $path: $!";
my @dirs = grep { ! /^[.]{1,2}/ && -d "$path/$_" } readdir($dh);
closedir($dh);
return undef if !scalar @dirs; # nothing to do here, directory empty
my $vals = []; # set our result to an empty array
foreach my $dir (@dirs) { # loop the sub directories
my $res = parse_dir("$path/$dir"); # recurse down each path and get results
# does the returned value have a result, and is that result an array of at
# least one element, then add these results to our $vals anonymous array
# wrapped in a anonymous hash
# ELSE
# push just the name of that directory our $vals anonymous array
push(@$vals, (defined $res and scalar @$res) ? { $dir => $res } : $dir);
}
return $vals; # return the recursed result
}
그런 다음 제안된 디렉터리 구조에서 스크립트를 실행합니다.
./tree2json2.pl .
{
"dir2" : [
"dirB",
"dirA"
],
"dir1" : [
"dirB",
{
"dirA" : [
"dirBB",
"dirAA"
]
}
]
}
나는 이것을 올바르게 이해하기가 매우 어렵다는 것을 알았습니다 (특히 "하위 디렉토리라면 해시, 그렇지 않으면 배열, 최상위 레벨이 아닌 이상 해시 일뿐입니다"논리). 그래서 이것이 당신이 할 수 있는 일이라면 나는 놀랄 것입니다 sed
/ awk
...하지만 Stephen은 아직 이것을 본 적이 없을 것입니다 :)
답변3
이는 Perl과 JSON Perl 모듈을 사용하는 한 가지 방법입니다.
$ tree | perl -e 'use JSON; @in=grep(s/\n$//, <>); \
print encode_json(\@in)."\n";'
예
샘플 데이터를 만듭니다.
$ mkdir -p dir{1..5}/dir{A,B}
다음과 같습니다.
$ tree
.
|-- dir1
| |-- dirA
| `-- dirB
|-- dir2
| |-- dirA
| `-- dirB
|-- dir3
| |-- dirA
| `-- dirB
|-- dir4
| |-- dirA
| `-- dirB
`-- dir5
|-- dirA
`-- dirB
15 directories, 0 files
이는 Perl 명령을 사용하여 실행됩니다.
$ tree | perl -e 'use JSON; @in=grep(s/\n$//, <>); print encode_json(\@in)."\n";'
다음 출력을 반환합니다.
[".","|-- dir1","| |-- dirA","| `-- dirB","|-- dir2","| |-- dirA","| `-- dirB","|-- dir3","| |-- dirA","| `-- dirB","|-- dir4","| |-- dirA","| `-- dirB","`-- dir5"," |-- dirA"," `-- dirB","","15 directories, 0 files"]
노트:이것은 출력에 대한 래퍼일 뿐입니다 tree
. 중첩된 계층 구조가 아닙니다. 내가 이것을 제안한 후 OP가 질문을 변경했습니다!
답변4
그러면 작업이 완료됩니다.https://gist.github.com/debodirno/18a21df0511775c19de8d7ccbc99cb72
import os
import sys
import json
def tree_path_json(path):
dir_structure = {}
base_name = os.path.basename(os.path.realpath(path))
if os.path.isdir(path):
dir_structure[base_name] = [ tree_path_json(os.path.join(path, file_name))\
for file_name in os.listdir(path) ]
else:
return os.path.basename(path)
return dir_structure
if len(sys.argv) > 1:
path = sys.argv[1]
else:
path = '.'
print json.dumps(tree_path_json(path), indent = 4, separators = (', ', ' : '))