HP-UX에서 쉘 스크립트 성능을 향상시키기 위해 루프를 한 줄 명령으로 변환

Question

while read line; do
    bytes=` echo $line | wc -c `
done

이것은 느린 부분일 수 있습니다. 각 입력 라인에 대해 외부 명령을 실행하고 있기 때문입니다.

ksh에서는 ${#line}간단히 다음을 사용하여 해당 변수의 문자열 길이를 얻을 수 있습니다. 그러나 다중 바이트 문자가 있는 경우 쉘은 각 전체에 대해 하나씩 계산할 수 있습니다.특징, wc -c각각 하나씩 계산 하면서바이트. 스크립트가 C 로케일을 사용하도록 추가되어 LC_ALL=C모든 개별 바이트가 계산됩니다.

그러나 셸은 가장 빠르거나 가장 좋은 도구가 아닐 수도 있습니다. 스크립트를 올바르게 읽었다면 3000자를 초과하는 줄을 삭제하고 싶습니다. 다음과 같이 할 수 있습니다 grep(표준 BRE여야 함).

grep -e '^.\{0,300\}$' "$file"

아니면 awk를 사용하세요:

awk 'length <= 3000' "$file"

마찬가지로, 바이트 수를 계산하려면 C 로케일을 사용하는 것이 도움이 될 것입니다 LC_ALL=C awk ....

Answer 1

while read line; do
    bytes=` echo $line | wc -c `
done