문자열의 일부만 유지하면서 JSON 값의 문자열을 결합하는 방법은 무엇입니까?

문자열의 일부만 유지하면서 JSON 값의 문자열을 결합하는 방법은 무엇입니까?

나는 샘플을 가지고 있습니다 :

           "name": "The title of website",
           "sync_transaction_version": "1",
           "type": "url",
           "url": "https://url_of_website"

다음 출력을 얻고 싶습니다.

"The title of website"    url_of_website

프로토콜 접두사만 남도록( url_of_website이전 접두사는 제외) URL에서 프로토콜 접두사를 제거해야 합니다. http문제는 내가 sed여러 줄을 읽는 데 익숙하지 않다는 것입니다. 조사를 하면 나를 찾을 수 있습니다.https://unix.stackexchange.com/a/337399/256195, 여전히 결과를 얻을 수 없습니다.

구문 분석하려는 유효한 json 개체는 BookmarkGoogle 크롬에서 가져온 것입니다. 예:

{
   "checksum": "9e44bb7b76d8c39c45420dd2158a4521",
   "roots": {
      "bookmark_bar": {
         "children": [ {
            "children": [ {
               "date_added": "13161269379464568",
               "id": "2046",
               "name": "The title is here",
               "sync_transaction_version": "1",
               "type": "url",
               "url": "https://the_url_is_here"
            }, {
               "date_added": "13161324436994183",
               "id": "2047",
               "meta_info": {
                  "last_visited_desktop": "13176472235950821"
               },
               "name": "The title here",
               "sync_transaction_version": "1",
               "type": "url",
               "url": "https://url_here"
            } ]
            } ]
        }
    }
}

답변1

이것은 질문에 제공된 JSON 문서에서 작동합니다.

$ jq -r '.roots.bookmark_bar.children[]|.children[]|["\"\(.name)\"",.url]|@tsv' file.json
"The title is here"     https://the_url_is_here
"The title here"        https://url_here

그러면 .children[].roots.bookmark_bar.children[]배열 항목의 배열에 액세스하고 질문에 표시된 내용에 따라 형식이 지정된 문자열이 생성됩니다(두 데이터 사이에 탭 문자 포함).

큰따옴표가 필요하지 않은 경우 번거로움을 ["\"\(.name)\"",.url]그냥 으로 변경하면 됩니다 [.name,.url].

https://URL에서 제거하려면 다음을 사용하세요.

.url|ltrimstr("https://")

그리고 단지 .url.

관련 정보