Bash의 스크래블 도우미

Question 1

정규 표현식은 이러한 종류의 작업에 가장 적합한 도구는 아닙니다. 나는 다음과 같은 일을 할 것입니다 :

perl -CLASD -lne '
  BEGIN{$l0{$_}++ for (split "", shift)}
  %l = %l0; for (split "") {next LINE unless $l{$_}--}
  print' aacrt < /usr/share/dict/words

아니면 그 이후로 (적어도 프랑스어와 영어로는및 라틴 알파벳을 사용하는 다른 언어), Scrabble에는 A부터 Z까지 26개의 대문자만 있고(été는 ETE로 작성되고 cœur는 COEUR로 작성됨) GNU는 다음과 같습니다 iconv.

iconv -t us//TRANSLIT < /usr/share/dict/words |
  perl -CLASD -lne '
    BEGIN{$l0{$_}++ for (split "", uc shift)}
    %l = %l0; for (split "", uc $_) {next LINE unless $l{$_}--}
    print' croeu

또는 원시 형식으로 출력합니다.

perl -CLASD -MText::Unidecode -lne '
  BEGIN{$l0{$_}++ for (split "", uc shift)}
  %l = %l0; for (split "", uc unidecode $_) {next LINE unless $l{$_}--}
  print' croeu < /usr/share/dict/word

Answer

정규 표현식은 이러한 종류의 작업에 가장 적합한 도구는 아닙니다. 나는 다음과 같은 일을 할 것입니다 :

perl -CLASD -lne '
  BEGIN{$l0{$_}++ for (split "", shift)}
  %l = %l0; for (split "") {next LINE unless $l{$_}--}
  print' aacrt < /usr/share/dict/words

아니면 그 이후로 (적어도 프랑스어와 영어로는및 라틴 알파벳을 사용하는 다른 언어), Scrabble에는 A부터 Z까지 26개의 대문자만 있고(été는 ETE로 작성되고 cœur는 COEUR로 작성됨) GNU는 다음과 같습니다 iconv.

iconv -t us//TRANSLIT < /usr/share/dict/words |
  perl -CLASD -lne '
    BEGIN{$l0{$_}++ for (split "", uc shift)}
    %l = %l0; for (split "", uc $_) {next LINE unless $l{$_}--}
    print' croeu

또는 원시 형식으로 출력합니다.

perl -CLASD -MText::Unidecode -lne '
  BEGIN{$l0{$_}++ for (split "", uc shift)}
  %l = %l0; for (split "", uc unidecode $_) {next LINE unless $l{$_}--}
  print' croeu < /usr/share/dict/word

Question 2

여기서 일어나는 일은 {a,c,r,t}{a,c,r,t}{a,c,r,t}{a,c,r,t}사용 중인 쉘에 의해 확장됩니다. 즉, 첫 번째 ( )는 aaaa다음과 같이 입력한 것처럼 검색할 패턴 등임을 의미합니다.grepaaacaaar

grep aaaa aaac aaar aaat aaca ..... /usr/share/dict/words

이를 방지하려면 검색 패턴을 작은따옴표로 묶으세요.

grep '{a,c,r,t}{a,c,r,t}{a,c,r,t}{a,c,r,t}' /usr/share/dict/words

반면에 여기서 올바른 grep 구문을 사용하고 있는지 잘 모르겠습니다. 나는 다음을 사용할 것이다:

grep '[acrt][acrt][acrt][actr]' /usr/share/dict/words

@mueh가 언급한 것처럼 4개의 문자 조합과 일치합니다.

grep -xE '[acrt]{1,4}' /usr/share/dict/words

이 문자를 1~4개 조합으로 연결하세요.

Answer

여기서 일어나는 일은 {a,c,r,t}{a,c,r,t}{a,c,r,t}{a,c,r,t}사용 중인 쉘에 의해 확장됩니다. 즉, 첫 번째 ( )는 aaaa다음과 같이 입력한 것처럼 검색할 패턴 등임을 의미합니다.grepaaacaaar

grep aaaa aaac aaar aaat aaca ..... /usr/share/dict/words

이를 방지하려면 검색 패턴을 작은따옴표로 묶으세요.

grep '{a,c,r,t}{a,c,r,t}{a,c,r,t}{a,c,r,t}' /usr/share/dict/words

반면에 여기서 올바른 grep 구문을 사용하고 있는지 잘 모르겠습니다. 나는 다음을 사용할 것이다:

grep '[acrt][acrt][acrt][actr]' /usr/share/dict/words

@mueh가 언급한 것처럼 4개의 문자 조합과 일치합니다.

grep -xE '[acrt]{1,4}' /usr/share/dict/words

이 문자를 1~4개 조합으로 연결하세요.

Question 3

세트에 동일한 문자가 중복되고 일부 누락된 문자가 있는 항목이 포함되어 있으므로 중괄호의 Bash 확장은 유효한 순열을 생성하지 않습니다.

필요한 것은 문자 전체 또는 일부를 사용하는 크로스워드 퍼즐 도구입니다. 다행히도 이러한 도구는 이미 표준 Linux의 일부로 존재합니다. 그것은 알려져있다하나. 그것은 사용한다/usr/share/사전/단어기본 사전으로 사용됩니다.

사용 방법에 대한 예는 다음과 같습니다.

먼저 이 함수를 정의합니다(대화형).

$ mywords() { an -w "$1" -m 4 | awk '/^[a-z]*$/ {print length($0), $0}' | column; }

이제 ypltar라는 글자가 있다고 상상해 보세요. 전체 또는 부분적으로 사용된 유효한 사전 단어를 찾으려면:

$ mywords ypltar
6 partly        5 party         4 tray          4 tarp          4 pray          4 part
6 paltry        5 aptly         4 trap          4 rapt          4 play          4 arty

출력 단어를 4자 이상으로 제한하기 위해 함수에서 -m 4를 사용했습니다. 필요에 따라 변경할 수 있습니다. awk 비트는 대문자(고유 명사 등)가 포함된 사전 항목을 제외하는 데 사용됩니다.

Answer