다음 파일이 있습니다.
ICR1 +
ICR1+1+3199 +
ICR1+2526+2828 +
IRT1 +
IRT1+1+1489 +
IRT1+713+937 +
LSR1 -
LSR1+1+1175 -
LSR1+366+638 -
NME1 +
NME1+1+340 +
NME1+2+118 +
PWR1 -
PWR1+1+941 -
PWR1+724+939 -
Q0017 -
Q0017+1+162 -
Q0020 -
Q0020+1370+1513 -
Q0020+1+440 -
첫 번째와 두 번째 열은 탭으로 구분됩니다. 다음이 필요합니다.
ICR1 +
IRT1 +
LSR1 -
NME1 +
PWR1 -
Q0017 -
Q0020 -
필드 구분 기호 "+"와 함께 awk를 사용해 보았지만 두 번째 열에서도 +가 제거되었습니다.
답변1
awk의 필드 구분 기호를 공백으로 설정하거나 +
클래식 연관 배열 기반 중복 제거를 수행할 수 있습니다.
$ awk -F'[ \t+]' '!seen[$1]++' file
ICR1 +
IRT1 +
LSR1 -
NME1 +
PWR1 -
Q0017 -
Q0020 -
답변2
질문을 오해했을 수도 있지만 이것이 효과가 있는 것 같습니다.
grep -v '+.' file
산출:
ICR1 +
IRT1 +
LSR1 -
NME1 +
PWR1 -
Q0017 -
Q0020 -
답변3
나는 명령을 사용하여 sed
동일한 목표를 달성했습니다.
sed -n '/^.\{1,5\} .$/p' filename
산출
ICR1 +
IRT1 +
LSR1 -
NME1 +
PWR1 -
Q0017 -
Q0020 -
답변4
사용밀러:
mlr --tsv --implicit-csv-header --headerless-csv-output \
put -S '$1=gsub($1,"[+].+$","")' then uniq -a inputfile
출력은 다음과 같습니다
ICR1 +
IRT1 +
LSR1 -
NME1 +
PWR1 -
Q0017 -
Q0020 -