한 디렉토리에 31개의 파일이 있습니다. 파일 형식은 다음과 같습니다.
TimeStamop user-id
1471417712595 1936f35c-XXXX-XXXX-XXXX-49898523b8ea
1471417717238 e3153e8d-XXXX-XXXX-XXXX-7710089c77bb
1471417718730 4e470320-XXXX-XXXX-XXXX-29bc448f09a1
1471417719211 e8b6a6c0-XXXX-XXXX-XXXX-dd68d836fb31
1471417723775 cbc009c1-XXXX-XXXX-XXXX-88cda2b1b812
1471417723775 cbc009c1-XXXX-XXXX-XXXX-88cda2b1b812
1471417725790 c332eba7-XXXX-XXXX-XXXX-509c42a621d1
1471417725522 4712acf1-XXXX-XXXX-XXXX-11a24bcbe7c8
1471417601920 502bc0dd-XXXX-XXXX-XXXX-eff38b468461
1471417604615 8c6b2ef9-XXXX-XXXX-XXXX-9efb1223e383
나는 단지 그것으로부터 타임스탬프 정보를 얻고 싶고 Linux 쉘 스크립트를 사용하여 모든 타임스탬프를 파일에 쓰고 싶습니다. 총 파일 크기(31개 파일 크기)는 4.5GB입니다. 나는 이 작업을 수행하는 효율적인 방법을 원합니다. 저는 이것을 파이썬으로 해봤습니다. 하지만 쉘 스크립트에 있기를 바랍니다.
답변1
awk
파일이 포함된 디렉터리에서 를 사용하세요 .
awk 'FNR>1 {print $1}' * >output.txt
FNR>1
각 파일의 모든 레코드를 1보다 큰 레코드 번호와 일치시킵니다. 즉, 각 파일의 헤더를 제거합니다.이러한 레코드의 경우
{print $1}
타임스탬프인 첫 번째 필드만 인쇄됩니다.