텍스트 문서에서 책과 시를 검색하려고 합니다.

Question

사용행복하다(이전 Perl_6)

raku -e 'my @a = slurp.split(". "); my @b = @a.match(:global, / "(" ~ ")" .+? / ).join;  \
         @b.=split(/ \,\s* || <[()]> /, :skip-empty); .say for @b.map(*.tc).Bag.sort(-*.value);'

입력 예(OP의 첫 번째 참조는 복사되었으며 소문자임):

The Scriptures reveal it's the sons of Jerusalem (John 6:43-47, Isa 54:11, 13), (john 6:43-47), and it's these sons who serve God (Mal 3:17-18). and These two cities are examples of what happens to those who suffer death by eternal fire. Peter wrote: 2Pet 2:6 .. The ABYSS is where the most wicked of all demons are imprisoned (2Pet 2:4, Jude 1:6, Rev 9:1). For a further explanation of this place of restraint, see Luke 8:31, and note that Christ had the power to send these demons to the ABYSS.

예제 출력:

John 6:43-47 => 2
Jude 1:6 => 1
Rev 9:1 => 1
Isa 54:11 => 1
Mal 3:17-18 => 1
13 => 1
2Pet 2:4 => 1

Raku는 Perl 프로그래밍 언어 제품군에 속하며 여기서는 좋은 선택입니다. 특히 그리스어나 그리스어와 같은 유니코드 텍스트로 작업하려는 경우 더욱 그렇습니다.헤브라이 사람문자(Raku는 기본적으로 유니코드를 처리합니다).

즉, 파일은 " " 마침표 공간에 slurped(한 번에 모두 읽기) 및 (파괴적으로) 텍스트를 문장으로 나누는 것입니다. 이러한 요소는 배열 에 저장됩니다 . 두 번째 명령문에서는 배열이 정규 표현식 에 대해 테스트됩니다. 이는 Raku가 괄호가 있는 텍스트를 찾는 방법입니다( 정규 표현식도 작동하지만 다음 참고 사항을 참조하세요).split.@a@amatch"(" ~ ")" .+?"(" .+? ")"중첩된 구조). 이러한 일치 항목은 join편집되고(기본적으로 빈 요소 제거) 배열에 할당됩니다 @b.

세 번째 문에서 대괄호 안의 텍스트는 다시 (파괴적으로) 입니다 split. 이번에는 쉼표 다음에 선택적 공백이 오거나 \,\s*... 태그를 사용하여 생성되고 또는 로 구성된 <[()]>사용자 정의 문자 클래스입니다 . 이 예에서 사용하면 공백 요소가 제거됩니다. 이 결과는 배열에 다시 할당됩니다(예, 구문 설탕).<[]>()split(… , :skip-empty).=@b@b.=split(…)@b = @b.split(…)

마지막으로 네 번째 명령문에서 map(*.tc)요소는 @b제목 케이스인 -ged로 변환됩니다 Bag(참조:여기), (값 감소)에 의해 sort편집됩니다 -*.value. 출력은 .say for다음을 사용하여 한 줄씩 생성됩니다.

키와 값을 교환하고 출력 열을 전환(및 정렬 순서)하는 것은 매우 쉽습니다. 끝 부분을 변경하여 .say출력에서 화살표를 제거하고 .put탭 공백으로 구분된 두 개의 열을 남겨 둡니다.=>\t

https://raku.org

Answer 1