파일에서 특정 중복 줄을 제거하는 방법은 무엇입니까?

Question 1

GNU 사용 sed:

sed '0,/^AAA$/b;//d'

즉, 첫 번째 행(행 0(첫 번째 행 이전에도)과 첫 번째 일치 행 (첫 번째 행일 수 있음)) 까지 모든 것을 통과( ba 처럼 분기 )한 다음 나머지 줄에서 모든 항목을 삭제합니다. (빈 패턴은 마지막 패턴을 재사용합니다)continueAAA/^AAA$/AAA//

sedAddress에는 GNU가 필요합니다 ( 동일 표현식에서 명령 뒤에 다른 명령을 포함할 0수 있는 기능도 있지만 이는 두 표현식을 사용하여 다른 구현에서 쉽게 해결할 수 있음 ).b-e

그리고 awk:

awk '$0 != "AAA" || !n++'

(또는 정규식 패턴의 경우 awk '!/^AAA$/ || !n++':)

약어:

awk '! (&0 == "AAA" && count > 0) {print; count++}'

Answer

GNU 사용 sed:

sed '0,/^AAA$/b;//d'

즉, 첫 번째 행(행 0(첫 번째 행 이전에도)과 첫 번째 일치 행 (첫 번째 행일 수 있음)) 까지 모든 것을 통과( ba 처럼 분기 )한 다음 나머지 줄에서 모든 항목을 삭제합니다. (빈 패턴은 마지막 패턴을 재사용합니다)continueAAA/^AAA$/AAA//

sedAddress에는 GNU가 필요합니다 ( 동일 표현식에서 명령 뒤에 다른 명령을 포함할 0수 있는 기능도 있지만 이는 두 표현식을 사용하여 다른 구현에서 쉽게 해결할 수 있음 ).b-e

그리고 awk:

awk '$0 != "AAA" || !n++'

(또는 정규식 패턴의 경우 awk '!/^AAA$/ || !n++':)

약어:

awk '! (&0 == "AAA" && count > 0) {print; count++}'

Question 2

Stéphane Chazelas의 awk솔루션아름답다:

awk '!/AAA/ || !n++' file.in

이는 다음과 같이 요약될 수 있습니다.

awk '$0 !~ pattern || !n++' pattern="$pattern" file.in

$pattern일부 정규식을 포함하는 특정 쉘 변수의 경우.

백슬래시를 포함하는 경우 $pattern이스케이프 처리( \\)해야 합니다. 또는 다음을 사용할 수 있습니다.

P="$pattern" awk '$0 !~ ENVIRON["P"] || !n++' file.in

Answer