텍스트가 많은 텍스트 파일이 있고 각 단어를 다른 단어 아래에 정렬하고 싶습니다. 어떻게 해야 합니까? 예를 들어.
cat PDF | less
word one, word two. Word three ?
나는 그것들이 필요해
word
one
word
two
Word
three
답변1
이것은 내가 시퀀싱이라고 부르는 것이 아닙니다.
알파벳이 아닌 모든 시퀀스를 개행 문자로 압축하고 음역할 수 있습니다.
tr -sc '[:alpha:]' '[\n*]' < PDF
또는 (적어도 GNU grep을 사용하여) 시퀀스를 일치시키고 출력합니다.단어-o
이 옵션을 사용하면 한 줄에 하나씩 문자(문자, 십진수 및 밑줄)를 사용할 수 있습니다.
grep -o '\w*' PDF