오래 전 UNIX Seventh Edition(a/k/a V7)에는 prep
. 다루다. 또한 파일에 있는 각 단어의 위치를 알려주거나, 무시 목록의 특정 단어를 무시하거나, 포함 목록에 특별히 언급된 단어에만 초점을 맞추는 등 몇 가지 다른 작업도 수행할 수 있습니다. 정확히 무엇을 하는지 설명하기는 어렵지만, 여기에 하나가 있습니다.매뉴얼 페이지2.9BSD부터 시작합니다. 예를 들어 사전 작성, 맞춤법 검사기 등 모든 종류의 흥미로운 용도가 있습니다.
계획은 다소 짧았습니다. 이는 V7과 몇 개의 포크에만 존재합니다(2.9BSD는 기본적으로 V7의 포크입니다). 이전에는 V6에는 존재하지 않았습니다. V8에서 제거되었습니다. 심지어 4.2BSD에도 도달하지 못했습니다. 내가 아는 한, 이는 어떤 Linux 배포판(적어도 이 형식은 아님)이나 FreeBSD 및 기타 다른 배포판에는 존재하지 않습니다. (내가 아는) V7에 처음 나온 또 다른 프로그램인 가 있는데 deroff
, 이 프로그램은 대부분 완전히 다른 목적으로 사용되었지만 -w
"파일을 한 줄에 여러 단어로 분할"하라는 " " 옵션이 있었습니다. 와 유사 하지만 다른 기능(예: 단어 번호 매기기, 포함 목록 및 무시 목록)을 수행하지 않습니다. 사전 작성과 같은 목적으로 포함이 포함된 것으로 prep
가정합니다 . 상대적으로 수명이 훨씬 더 깁니다. 지금 당장은 어떤 주요 Linux 배포판용 패키지 버전도 아닌 것 같습니다 . 최신 버전의 RHEL이나 Fedora 32, Fedora 32 Debian 10에는 없는 것으로 알고 있습니다. 실제로 곧 출시될 예정입니다). 불과 몇 년 전에 데비안에 등장했습니다.deroff -w
prep
deroff
왜 prep
떠났나요? 실제로 deroff -w
대부분의 기능을 복제하기 때문입니까 ? deroff
사람들은 일반적으로 매뉴얼 페이지를 제외하고는 더 이상 [nt]roff 형식의 문서를 다루지 않기 때문에 현재 Linux 배포판에서는 이것이 사라진 것 같습니다 . 하지만 이 두 도구가 사라진 상태에서 "텍스트 파일을 한 줄에 한 단어로 분할" 기능을 달성하기 위해 무엇을 사용할 수 있습니까? 이 기능을 수행할 수 있는 기능이 포함된 최신 Linux 배포판이 있습니까? ("간단한 스크립트로 이 작업을 직접 수행할 수 있습니다"라고 대답한다면 아마도 그것이 맞을 것이라는 점을 인정합니다. 하지만 그것은 제가 지금 찾고 있는 대답이 아니며 이미 존재하는 것을 사용하여 답을 찾고 있습니다. 최신 Linux 배포판에서는 이 작업을 수행하기 위한 기존 도구가 있습니다...) 이상적으로는 제가 링크한 매뉴얼 페이지에 나열된 모든 기능과 매뉴얼 페이지에 명시적으로 지정된 "암시된" 동작을 구현하는 것을 찾고 싶습니다. 예는 다음과 같습니다. 구두점을 단어의 일부로 고려하지 않고 "단어"의 일부로 나타나는 숫자를 처리하는 방법). :-) 사실 저는 포함 목록과 제외 목록이 특별히 중요하다고 생각하지 않습니다. 단어에 번호를 매기고 싶지만(때로는 파일에서 단어가 어디에 있는지 아는 것이 편리합니다) 그다지 중요하지 않습니다. 줄 끝에서 하이픈으로 연결된 단어를 처리하는 것이 바람직합니다.
답변1
tr -s " " "\n" < file
파일을 한 줄에 한 단어로 분할하는 데 작동하는 것 같습니다 .