고유한 체크섬이 있는 행

Question 1

귀하가 지정한 대로(그러나 귀하의 질문에 대한 wurtel의 의견을 고려하십시오):

generate_keys A > B   # adjust this call however that program is defined to work

awk '
  NR==FNR { a[NR]=$1 ; next }
  !b[$1]++ { print a[FNR] }
' A B

Answer

귀하가 지정한 대로(그러나 귀하의 질문에 대한 wurtel의 의견을 고려하십시오):

generate_keys A > B   # adjust this call however that program is defined to work

awk '
  NR==FNR { a[NR]=$1 ; next }
  !b[$1]++ { print a[FNR] }
' A B

Question 2

일부 샘플 데이터 없이는 테스트할 수 없지만 다음과 같습니다.

paste <(generate-keys "$filename") "$filename" |
awk '! seen[$1]++ {print $2}'

Answer

일부 샘플 데이터 없이는 테스트할 수 없지만 다음과 같습니다.

paste <(generate-keys "$filename") "$filename" |
awk '! seen[$1]++ {print $2}'

Question 3

$ getkeys A > B
$ sort B | uniq -c | awk '{if($1 == 1) print $2}' > C
$ paste B A | fgrep -f C | cut -f2-

설명하다:

먼저 각 행에 대한 키를 생성합니다.

그런 다음 각 키가 나타나는 횟수를 세고 한 번 나타나는 키를 파일 C에 저장합니다.

그런 다음 paste이 행을 고유 키 목록과 일치시킨 fgrep다음 해당 행만 선택하는 데 사용합니다(키 생략) cut.

C의 문자열이 a로 시작 ^하고 grepnot을 사용하여 fgrep핵심인 줄의 시작 부분과만 일치하도록 하는 것이 더 낫습니다. 그러나 md5sum과 같은 것이라면 잘못된 일치 가능성은 희박합니다. (그리고 나는 게으르다 :-))

Answer

$ getkeys A > B
$ sort B | uniq -c | awk '{if($1 == 1) print $2}' > C
$ paste B A | fgrep -f C | cut -f2-