렌더링되지 않는 문자가 포함된 문자열에 대해 grep 실행

렌더링되지 않는 문자가 포함된 문자열에 대해 grep 실행

그래서 Windows의 Notepad++에서 검색할 수 있는 log.txt 파일이 있지만 그 수가 너무 많아서 grep을 실행할 수 있기를 원합니다. 그러나 데이터는 렌더링되지 않는 문자로 형식이 지정되어 있으며 이를 grep에 포함하는 방법을 모르겠습니다. Notepad++는 검정색 RS로 표시됩니다. 데이터는 비슷한 형식이므로 [RS]value1[RS]value2value1과 value2를 찾으려면 grep을 사용할 수 있어야 합니다. 이 형식은 이러한 파일 전체에서 변경되지 않습니다.

grep을 통해 이를 검색하려면 어떻게 해야 합니까? 사용할 수 있는 이스케이프 시퀀스 형식이 있나요? 아니면 이 비렌더링 캐릭터의 존재를 검색 value1하고 완전히 무시 하도록 해야 합니까 ?value2

답변1

귀하의[RS]= 레코드 구분 기호[1]기록 구분 기호문자 ASCII 30 0x1E

이 지식을 사용하여 수행할 수 있습니다 grep(주석에서 제안한 대로). 또는 보다 일반적으로 사용하려면 $'\x1e'또는 일치하는 문자 클래스를 사용할 수 있습니다.[^[:print:]][[:cntrl:]]

관련 정보