공통 문자열을 표시하는 연속된 두 줄의 위치를 바꿉니다.

Question 1

awk의 무차별 대입 방법: 항상 행을 저장하고 필드 1에서 일치하는 후속 행을 승격합니다.

백만 개의 행(스왑 하나 사용)에서 테스트했는데 5.5초 만에 실행되었으므로 런타임은 1분 남짓이 될 것입니다. 참조 파일이 필요하지 않습니다.

테스트 라인이 포함된 HereDoc을 포함한 스크립트입니다.

#! /bin/bash

awkPairs () {

    local Awk='
FNR == 1 { k = $2; x = $0; next; } 
$2 != k { print x; k = $2; x = $0; next; } 
{ print $0; }
END { print x; }
'
    awk -f <( printf '%s' "${Awk}" ) -
}

    [ x ] && time awkPairs <<'[][]'
WT 1 One x1
WT 2 Two x2
WT 3 Three_1 x3
WT 3 Three_2 y3
WT 4 Four x4 
WT 5 Five_1 x5
WT 5 Five_2 y5
[][]

(단기) 테스트 실행.

$ ./awkPairs
WT 1 One x1
WT 2 Two x2
WT 3 Three_2 y3
WT 3 Three_1 x3
WT 4 Four x4
WT 5 Five_2 y5
WT 5 Five_1 x5

real    0m0.009s
user    0m0.004s
sys     0m0.006s

모든 테스트 자료 스크립트를 제거했습니다. 단일 인수(입력 파일 이름) 또는 리디렉션되거나 파이프되는 표준 입력을 사용하여 호출할 수 있습니다. 출력은 항상 stdout으로 이동합니다.

#! /bin/bash

awkPairs () {

    local Awk='
FNR == 1 { k = $2; x = $0; next; }
$2 != k { print x; k = $2; x = $0; next; }
{ print $0; }
END { print x; }
'
    awk -f <( printf '%s' "${Awk}" ) "${1:--}"
}

    awkPairs "${1}"

따라서 다음 방법 중 하나로 호출할 수 있습니다.

./awkPairs myData.txt
./awkPairs < myData.txt
cat myData.txt | ./awkPairs

Answer

awk의 무차별 대입 방법: 항상 행을 저장하고 필드 1에서 일치하는 후속 행을 승격합니다.

백만 개의 행(스왑 하나 사용)에서 테스트했는데 5.5초 만에 실행되었으므로 런타임은 1분 남짓이 될 것입니다. 참조 파일이 필요하지 않습니다.

테스트 라인이 포함된 HereDoc을 포함한 스크립트입니다.

#! /bin/bash

awkPairs () {

    local Awk='
FNR == 1 { k = $2; x = $0; next; } 
$2 != k { print x; k = $2; x = $0; next; } 
{ print $0; }
END { print x; }
'
    awk -f <( printf '%s' "${Awk}" ) -
}

    [ x ] && time awkPairs <<'[][]'
WT 1 One x1
WT 2 Two x2
WT 3 Three_1 x3
WT 3 Three_2 y3
WT 4 Four x4 
WT 5 Five_1 x5
WT 5 Five_2 y5
[][]

(단기) 테스트 실행.

$ ./awkPairs
WT 1 One x1
WT 2 Two x2
WT 3 Three_2 y3
WT 3 Three_1 x3
WT 4 Four x4
WT 5 Five_2 y5
WT 5 Five_1 x5

real    0m0.009s
user    0m0.004s
sys     0m0.006s

모든 테스트 자료 스크립트를 제거했습니다. 단일 인수(입력 파일 이름) 또는 리디렉션되거나 파이프되는 표준 입력을 사용하여 호출할 수 있습니다. 출력은 항상 stdout으로 이동합니다.

#! /bin/bash

awkPairs () {

    local Awk='
FNR == 1 { k = $2; x = $0; next; }
$2 != k { print x; k = $2; x = $0; next; }
{ print $0; }
END { print x; }
'
    awk -f <( printf '%s' "${Awk}" ) "${1:--}"
}

    awkPairs "${1}"

따라서 다음 방법 중 하나로 호출할 수 있습니다.

./awkPairs myData.txt
./awkPairs < myData.txt
cat myData.txt | ./awkPairs

Question 2

GNU sed는 확장 정규식 모드에 있습니다 -E(정규식을 덜 시끄럽게 만듭니다). 패턴 공간에 두 줄을 저장하고 두 줄의 첫 번째 필드를 비교합니다. 일치하면 패턴 공간에서 교체된 줄을 인쇄하고 다음 줄을 읽습니다.

sed -Ee '
  $!N
  s/^(\S+\s+(\S+)\s.*)\n(\S+\s+\2\s.*)/\3\n\1/
  t;P;D
' file

참고: 이는 "파일"에 선행 공백이 없다고 가정합니다.

Answer

GNU sed는 확장 정규식 모드에 있습니다 -E(정규식을 덜 시끄럽게 만듭니다). 패턴 공간에 두 줄을 저장하고 두 줄의 첫 번째 필드를 비교합니다. 일치하면 패턴 공간에서 교체된 줄을 인쇄하고 다음 줄을 읽습니다.

sed -Ee '
  $!N
  s/^(\S+\s+(\S+)\s.*)\n(\S+\s+\2\s.*)/\3\n\1/
  t;P;D
' file

참고: 이는 "파일"에 선행 공백이 없다고 가정합니다.

Question 3

가정만오른쪽바꿔야 하는 줄 수(즉, 동일한 두 번째 필드에 3개 이상의 연속 줄이 아님), 파일에 최소한 두 줄이 포함되어 있습니다.

function possibly_swap() {
        if (stringa == stringb) {
                # The two previous lines needs swapping.
                t = linea
                linea = lineb
                lineb = t
        }
}

FNR >= 3 {
        possibly_swap()

        # Output the 2nd previous line (possibly swapped now).
        print lineb
}

{
        # Push new data.

        stringb = stringa
        lineb = linea

        stringa = $2
        linea = $0
}

END {
        # We may need to output the last two
        # lines swapped...
        possibly_swap()

        print lineb
        print linea
}

프로그램 은 두 개의 awk변수 세트, stringa및 stringb를 사용합니다 . 변수에는 입력 라인의 가장 최근 두 라인 중 두 번째 필드인 문자열이 포함됩니다. 변수 에는 해당하는 내용이 포함되어 있습니다.linealinebstringline가득한철사.

코드 전체에 사용된 접미사 합계는 이전 줄과 그 앞 줄("앞의 두 번째 줄")에 a해당합니다 .b

위 코드를 자체 파일(여기서는 )에 넣고 아래와 같이 다른 파일(여기서는 ) script.awk에서 실행할 수 있습니다.file

awk -f script.awk file

"one-liner"와 동일한 코드:

awk 'FNR>=3{if(sa==sb){t=la;la=lb;lb=t}print lb}{sb=sa;lb=la;sa=$2;la=$0}END{if(sa==sb){print la;print lb}else{print lb;print la}}' file

Answer