줄 끝 문자에 관계없이 파일의 줄 수 계산

Question 1

귀하의 명령은 다음을 사용하여 grep너무 많은 일치 항목을 제공합니다.grep기본 정규식, 특별한 의미가 부여되지 않은 \r문자 "r"의 발생 횟수를 계산합니다.

tr 하다모든 일치 항목을 찾아 바이트별로 계산 하도록 \n합계를 식별합니다 .\rwc -c

tr -d -c '\n\r' < file.txt | wc -c

그러나 파일에 Windows/DOS 줄 종결자( \r\n)가 포함될 수도 있으므로 이러한 줄 종결자는 두 번 계산됩니다. DOS 스타일 줄 끝을 다른 형식 중 하나로 변환한 다음 이전과 같이 개별 줄 끝을 계산하려면 추가 단계가 필요합니다.

sed 's/\r$//' file.txt | tr -d -c '\n\r' | wc -c

sed안타깝게도 둘 중 하나를 식별하는 것이 항상 가능한 것은 아닙니다 \r. 쉘 자체 이스케이프, 명령 echo또는 sed 스크립트를 파일에 넣는 것과 같은 캐리지 리턴을 지정하는 다른 방법을 사용해야 할 수도 있습니다.

Answer

귀하의 명령은 다음을 사용하여 grep너무 많은 일치 항목을 제공합니다.grep기본 정규식, 특별한 의미가 부여되지 않은 \r문자 "r"의 발생 횟수를 계산합니다.

tr 하다모든 일치 항목을 찾아 바이트별로 계산 하도록 \n합계를 식별합니다 .\rwc -c

tr -d -c '\n\r' < file.txt | wc -c

그러나 파일에 Windows/DOS 줄 종결자( \r\n)가 포함될 수도 있으므로 이러한 줄 종결자는 두 번 계산됩니다. DOS 스타일 줄 끝을 다른 형식 중 하나로 변환한 다음 이전과 같이 개별 줄 끝을 계산하려면 추가 단계가 필요합니다.

sed 's/\r$//' file.txt | tr -d -c '\n\r' | wc -c

sed안타깝게도 둘 중 하나를 식별하는 것이 항상 가능한 것은 아닙니다 \r. 쉘 자체 이스케이프, 명령 echo또는 sed 스크립트를 파일에 넣는 것과 같은 캐리지 리턴을 지정하는 다른 방법을 사용해야 할 수도 있습니다.

Question 2

gawk 'END {print NR}' RS='\r|\n|\r\n' file.txt

이 RS변수는 개행 문자로 간주되는 항목( gawk이 경우 정규식)을 지정합니다.

Answer

gawk 'END {print NR}' RS='\r|\n|\r\n' file.txt

이 RS변수는 개행 문자로 간주되는 항목( gawk이 경우 정규식)을 지정합니다.

관련 정보