줄의 최대 및 최소 길이 제한

줄의 최대 및 최소 길이 제한

다음과 같은 입력이 있습니다.

XX3083136|bla-bla texthere texttt|[email protected]|SADFdsafsafd|ASDfasfdsafd|DSFSAFD|dsafasfd|sadfsad|
XX3083372|bla-bla-bla this is a text bla-bla|[email protected]|SDFsafas|SADFsa|DFSsdf|asdasdf|sadfdsafsaf|asdfsadf|

다음 출력이 필요합니다.

XX3083136|bla-bla texthere textt|[email protected]         |SADFdsafsafd|ASDfasfdsafd|DSFSAFD|dsafasfd|sadfsad|
XX3083372|bla-bla-bla this is a te|[email protected]      |SDFsafas|SADFsa|DFSsdf|asdasdf|sadfdsafsaf|asdfsadf|

따라서 차이점은 "|" 사이의 최대 텍스트 길이를 제어해야 한다는 것입니다. 주어진 행 길이보다 짧은 경우 ""를 입력해야 합니다. 이 예에서 두 번째 줄은 최대 24자로 제한되며, 세 번째 줄은 30자 이상이어야 합니다. 행마다 다른 최대/최소 제한이 필요합니다.

Bash에서 어떻게 할 수 있나요?

답변1

약간의 추가사항:

printf텍스트의 기본 형식은 다음과 같습니다.

%s      # Print as is
%10     # Right justify minimum width print 10
%-10    # Left justify minimum width print 10
%.10    # Max width 10
%10.10  # Max width 10, min width print 10
%-10.10 # Left justify, max width 10, min width print 10
%*s     # Same as above, but get number from arguments
%-*s    # Same as above, but get number from arguments
...

매우 긴 패턴을 얻을 때, 어디와 어떤 것 등을 추적하는 것이 약간 혼란스러울 수 있습니다. 더 쉽게 만드는 한 가지 방법은 다음과 같습니다.

#!/bin/bash

usage()
{
    printf "Usage: %s <FILE>\n" "$(basename "$0")" >&2
    [[ -n "$1" ]] && echo "$1"
    exit 1
}

if [[ ! -t 0 ]]; then
    : # Piped to
elif [[ $# -eq 0 ]]; then
    usage "Missing file."
elif [[ ! -r "$1" ]]; then
    usage "Unable to read \`$1'."
else
    # Accept input from file to file descriptor 0, aka stdin
    exec 0< "$1"
fi

fmt=""
fmt="$fmt%s|"       # F1
fmt="$fmt%-24.24s|" # F2
fmt="$fmt%-30s|"    # F3
fmt="$fmt%-10.10s|" # F4
fmt="$fmt%-10.10s|" # F5
fmt="$fmt%-10s|"    # F6
fmt="$fmt%-2.2s|"   # F7
fmt="$fmt%-2.2s|\n" # F8

# Set IFS to newline and bar and read fields
# assigning them to f1 ... f8
#
while IFS=$'\n'"|" read f1 f2 f3 f4 f5 f6 f7 f8; do
    printf "$fmt"\
    "$f1" "$f2" "$f3" "$f4" \
    "$f5" "$f6" "$f7" "$f8"
done <&0

또는. 예를 들어:

while IFS=$'\n'"|" read f1 f2 f3 f4 f5 f6 f7 f8; do
    printf "%s|%-*.*s|%-*s\n" \
    "$f1" \
    24 24 "$f2" \
    30 "$f3"
done < "input"

단지 라인 구문 분석이라면 awk가 좋은 선택입니다. 예를 들어:

#!/usr/bin/awk -f

BEGIN {FS="|"}
/^/ {
    printf "%s|%-24.24s|%-30s|%-10.10s|%-10.10s|%-10s\n",
        $1, $2, $3, $4, $5, $6
}

또는:

#!/usr/bin/awk -f

BEGIN {
    FS="|"
}
/^/ {
    printf "%s|%-*.*s|%-*s|%-*.*s|%-*.*s|%-*s\n",
        $1,
        24, 24, $2,
        30, $3,
        10, 10, $4,
        10, 10, $5,
        10, $6
}

답변2

printf내장 함수를 사용하여 문자열을 잘라낼 수 있습니다 :

$ printf '%.2s\n' 'azerty'
az

|이를 사용하여 원하는 위치에 구분 기호를 입력합니다 . 예를 들면 다음과 같습니다.

$ printf '%10s%10s%10s%10s%10s%10s\n' '|' '|' '|' '|' '|' '|'
         |         |         |         |         |         |

바라보다http://www.bash-hackers.org/wiki/doku.php/commands/buildin/printf

관련 정보