매우 큰 텍스트 파일의 일부를 다운스트림 작업(Python)으로 파이프하고 싶습니다.
기본적으로 모든 홀수 및 짝수 줄의 처음 n개 문자를 가져오고 싶지만 여전히 줄 순서를 유지하고 싶습니다.
그 이유는 짝수 줄이 매우 길지만 처음 몇 글자만 필요하기 때문입니다. 이렇게 하면 Python으로 파일을 더 빠르게 읽을 수 있습니다.
답변1
해결책은 다음과 같습니다 awk
.
$ cat testfile
foo
asdkjasjdka
bar
kjsdksjdkssd
$ awk -v n=2 'NR % 2 == 1 { print } NR % 2 == 0 { print substr($0, 1, n) }' testfile
foo
as
bar
kj