"올바른"단어 세트에 대한 Grep 스트림?

"올바른"단어 세트에 대한 Grep 스트림?

이것은 매우 기본적인 질문인 것 같지만 이를 구현하는 최선의 방법을 모르겠습니다. 여러 문서(Latex로 작성됨)가 있고 해당 spell문서에 대해 프로그램을 실행하여 철자 오류 목록을 생성하려고 합니다.

spell -n -o *.tex | sort -k2 | uniq >misspelt.txt

물론 문제는 유효하다고 간주되는 일부 키워드의 철자가 틀렸다는 것입니다. 예를 들어 파일의 한 줄은 다음과 같습니다.

...
/home/me/Documents/doc1.tex: documentclass
...

비슷한 단어를 파일에 넣고 documentclass위 명령의 일부로 병합하여아니요철자 오류로 간주되나요?

답변1

detex(1)LaTeX 명령(대부분의 명령)을 제거하고 맞춤법 검사기를 통해 결과를 실행하는 데 사용됩니다 .

Terdon의 답변에서 알 수 있듯이 적어도 직접적으로는 텍스트가 아닌 맞춤법을 검사할 수 없습니다. 예를 들어 확인하십시오.aspell(1)맞춤법 검사 전에 적용할 필터 목록은 이 명령이 원하는 것을 정확하게 제공하는 aspell dump filters것 같습니다 .aspell list

답변2

이것은 작동하지 않을 것입니다. 텍스트가 아닌 콘텐츠에만 맞춤법 검사기를 사용할 수는 없습니다. 예를 들어, \begin의 철자가 틀렸다는 것을 눈치채지 못할까요? 괜찮은 텍스트 인식 편집기에서 파일을 열고 편집기의 맞춤법 검사를 실행해 보셨나요? 아니면 파일을 PDF나 다른 형식으로 컴파일하고, 컴파일된 문서의 텍스트를 복사한 다음 맞춤법 검사를 실행하시겠습니까?

어쨌든 원하는 대로 작동하려면 예상대로 작동할지 의심되더라도 grepto라는 단어가 포함된 파일 을 전달하여 -v일치하는 줄을 건너뛸 수 있습니다.

spell -n -o *.tex | sort -k2 | grep -vf keywords.txt | uniq >misspelt.txt

관련 정보