/usr/share/dict/words에 있는 단어는 어디에서 왔나요?

/usr/share/dict/words에 있는 단어는 어디에서 왔나요?

/usr/share/dict/words많은 단어가 포함되어 있습니다. 이 목록은 어떻게 생성되나요? 다른 Unices에서도 내용이 동일합니까? 어떤 내용을 포함해야 하는지 규정하는 표준이 있나요?

지금까지 내가 찾을 수 있는 것은 Ubuntu/Debian뿐입니다. 이 목록은 다음에서 가져왔습니다.단어 목록패키지에 대한 설명은 목록이 실제로 어떻게 생성되는지에 대한 단서를 제공하지 않습니다.

답변1

여러 가지 질문을 주셨는데, 제가 생각하는 주요 질문은 다음과 같습니다.

어떤 내용을 포함해야 하는지 규정하는 표준이 있나요?

내가 아는 한, 아니오.

이에 비추어 관련 질문은 다음과 같습니다.

이 목록은 어떻게 생성되나요? 다른 Unices에서도 내용이 동일합니까?

"각각의 Unix에 따라 다릅니다."라고 대답하십시오.

운영 체제의 일부로 단어 목록을 갖는 규칙은 다음과 같습니다.spell(1)유틸리티, 원래 맞춤법 검사 프로세스에 사용됩니다.

맞춤법 검사기는 학술 논문에 설명되어 있습니다."철자법 목록의 개발" McIlroy, MD, Bell Laboratories, 1982.

철자 목록이 어디에서 왔는지, 어떻게 생성되는지, 어떤 대안이 있는지 확인하려면 운영 체제의 패키지 관리자를 확인해야 합니다.

Debian GNU+Linux를 예로 들어보겠습니다:

  • /usr/share/dict/words파일은 데비안 "대체" 시스템을 사용하여 관리되는 심볼릭 링크입니다.
  • 이 링크를 제공하는 범용 단어 목록 패키지가 wamerican패키지입니다.
  • 패키지 문서에는 wamerican해당 단어 목록이 다음에서 유래했다고 명시되어 있습니다.SCOWL(맞춤법 검사기용 단어 목록)프로젝트.

설치할 수 있는 다른 단어 목록 패키지가 많이 있습니다. 각 패키지에는 "제공: 단어 목록" 필드가 있습니다.

$ aptitude search '?provides(wordlist)' | wc -l
34

다른 Unices에서는 단어 목록의 출처와 대체를 이해하려면 패키지 시스템과 문서를 확인해야 합니다.

관련 정보