동시에 검색되는 2개의 문자열이 있는 .txt 확장자가 있거나 없는 파일에 대한 디렉터리를 재귀적으로 검색하고 싶습니다. 이 문제를 어떻게 처리해야 합니까?
예를 들어, 이 디렉터리에는 "String1", "String2" 및 "String3"을 포함하는 5개의 파일이 있습니다. 그 중 2개는 .pdf와 .html인데 관심이 없습니다. 나머지 3개는 .txt 파일이거나 확장자가 없습니다. 모든 문자열이 포함되어 있고 확장자가 .txt이거나 확장자가 전혀 없는 경로를 가져오고 싶습니다.
답변1
수정된 질문으로 업데이트되었습니다.
find directory -type f \( -name '*.txt' -o ! -name '*.*' \) \
-exec grep -q -F -e 'string 1' {} \; \
-exec grep -q -F -e 'string 2' {} \; \
-exec grep -q -F -e 'string 3' {} \; \
-print
이것은 재귀적으로 호출되는 디렉토리 에서 이름에 점이 없는 일반 파일뿐만 아니라 directory
파일 이름 접미사가 있는 일반 파일을 검색합니다. .txt
그러한 파일이 발견되면 grep
이전에 설명한 것과 유사한 방식으로 세 문자열이 모두 파일에 있는지 확인합니다(아래 참조).
문자열이 발견되면 파일의 경로 이름이 인쇄됩니다.
또는 첫 번째 부분(아래)의 코드를 사용하세요.
find directory -type f \( -name '*.txt' -o ! -name '*.*' \) -exec sh -c '
for pathname do
if grep -q -F -e "string 1" "$pathname" &&
grep -q -F -e "string 2" "$pathname" &&
grep -q -F -e "string 3" "$pathname"
then
printf "All were found in \"%s\"\n" "$pathname"
fi
done' sh {} +
또한보십시오:
질문을 수정하기 전의 이전 답변:
Unix는 파일 이름에서 파일 유형을 추론하지 않기 때문에 파일 이름은 중요하지 않습니다.
라는 파일에 특정 문자열이 있는지 테스트하려면 file
다음을 수행하십시오.
if grep -q -F -e 'some string' file; then
echo 'The string is present'
else
echo 'The string is not present'
fi
여기서 사용되는 옵션 grep
은
-q
: 조용해지며grep
, 패턴이 일치하는 즉시 종료됩니다. 패턴과 일치하는 행을 추출하는 대신 일치 항목이 발견되었는지 여부를 반영하는 종료 상태로 종료됩니다. 이 종료 상태는 위의 명령문에서 사용한 것입니다if
.-F
:grep
패턴이 정규식이 아닌 문자열로 처리됩니다. 이를 통해a * [in the] sky
유사한 문자열이 텍스트 내의 특수 문자를 이스케이프 처리하지 않고도 텍스트에 나타나는지 여부 를 테스트할 수 있습니다 .-e
:grep
다음 인수가 일치 패턴으로 처리됩니다. 이를 통해 명령줄 옵션으로 생각할-
필요 없이 로 시작하는 패턴을 사용할 수 있습니다 .grep
여러 문자열을 테스트하려면 grep
다음과 같이 추가 테스트를 추가하세요.
if grep -q -F -e 'string 1' file &&
grep -q -F -e 'string 2' file &&
grep -q -F -e 'string 3' file
then
echo 'All three string were found in the file'
else
echo 'One or more string was not found in the file'
fi
예를 들어 명명된 배열이 있는 셸을 사용한다고 가정하면 bash
배열에 문자열을 저장하고 다음과 같은 루프를 수행할 수도 있습니다.
strings=( 'string 1' 'string 2' 'string 3' )
found=true
for string in "${strings[@]}"; do
if ! grep -q -F -e "$string" file; then
found=false
break
fi
done
if "$found"; then
echo 'All strings were found'
else
echo 'Not all strings were found'
fi
이는 문자열을 반복하며 그 중 하나가아니요발견( !
테스트 결과를 부정한다는 점에 유의 grep
)한 다음 found
변수를 설정하고 false
루프를 종료합니다(추가 문자열을 테스트할 필요가 없습니다).
$found
그런 다음 그것이 true
또는 인지 테스트 false
하고 해당 테스트 결과에 따라 조치를 취합니다.
위의 셸 코드는 다음과 같이 다시 작성되었습니다 /bin/sh
(이름이 지정된 배열 없이).
set -- 'string 1' 'string 2' 'string 3'
found=true
for string do
if ! grep -q -F -e "$string" file; then
found=false
break
fi
done
if "$found"; then
echo 'All strings were found'
else
echo 'Not all strings were found'
fi
답변2
여러 문자열을 검색하는 것은 grep이 아닌 awk의 작업입니다.
find directory -type f \( -name '*.txt' -o ! -name '*.*' \) \
-exec awk '
index($0,"string 1"){x=1}
index($0,"string 2"){y=1}
index($0,"string 3"){z=1}
x && y && z { f=1; exit }
END { exit !f }
' {} \; \
-print
위의 awk에서는 입력 파일당 문자열당 한 번이 아니라 입력 파일당 한 번만 호출됩니다. 한 번에 한 줄씩 하드코딩하고 파일당 한 번만 awk를 호출하는 대신 원하는 수의 문자열을 찾는 스크립트를 작성하는 것도 간단합니다. 예를 들면 다음과 같습니다.
find directory -type f \( -name '*.txt' -o ! -name '*.*' \) \
-exec awk '
BEGIN {
totReqd = split("string 1 \
string 2 \
string 3", strings, /[[:space:]]+\n[[:space:]]+/)
}
{
for (idx in strings) {
if ( index($0,strings[idx]) ) {
totFound++
delete strings[idx]
}
}
}
totFound == totReqd { f=1; exit }
END { exit !f }
' {} \; \
-print
위의 두 가지 모두 테스트되지 않았지만 완전히 정확하지는 않더라도 거의 비슷해야 합니다. 한 번에 여러 파일에서 작동하도록 쉽게 수정할 수도 있습니다.
답변3
아래 질문을 업데이트하려면 -e 옵션을 사용하여 2가지 패턴을 grep할 수 있습니다. 보고 있는 파일에는 확장자가 필요하지 않습니다. 와일드카드만 사용하면 명령문이 다음과 같이 표시됩니다.
grep -e "word1" -e "word 2" /your/folder/*
또는 "txt"라는 단어가 포함된 파일의 3개 문자열에 대해서도 동일합니다.
grep 'word1\|word2\|word3' /your/folder/*txt*
그것을 시도하고 당신이 얻는 것을 확인하십시오
같은 줄에서 두 개의 문자열을 찾으려면 다음을 수행하십시오.
grep "word 1" /your/folder/* | grep "word 2"
그러면 첫 번째 grep의 결과가 다른 문자열을 사용하여 다른 grep으로 파이프됩니다. 아니면 다음을 수행
grep -e 'word1.*word2\|word2.*word1' /your/folder/*
따라서 word1을 먼저 찾은 다음 word2를 찾거나 그 반대의 경우도 마찬가지입니다.