중복된 줄을 제거하라는 명령을 내리지만 .txt 파일에 일부 변경 사항이 있습니다.

Question 1

$ awk -F: '$1 != p && /RESULT/ { print; p = $1 }' file
ligand_06278/out.pdbqt:REMARK VINA RESULT:      -8.3      2.094      2.612
ligand_06279/out.pdbqt:REMARK VINA RESULT:      -6.1      9.841     13.115
ligand_06280/out.pdbqt:REMARK VINA RESULT:     -10.0      3.811      7.264

RESULT그러면 입력 파일에 언급된 각 파일의 첫 번째 줄이 출력됩니다. 첫 번째 열(파일 이름)을 이전 줄의 첫 번째 열과 비교하고 현재 줄에 단어가 포함되어 있는지 테스트하여 이를 수행합니다 RESULT. 이전 줄과 파일 이름이 다른 줄이 발견되면 해당 줄은 업데이트된 RESULT값으로 그대로 인쇄됩니다.p

입력 파일이 grep여러 파일을 실행한 결과(아마도 grep search ) 와 매우 유사하다는 것을 알았습니다 REMARK.

모든 파일을 찾고 각 파일과 일치하는 첫 번째 줄을 얻으려면 다음을 수행하십시오 REMARK VINA RESULT.

find . -type f -path './ligand_*' -name 'out.pdbqt' -exec sed -n '/REMARK VINA RESULT/{p;q;}' {} ';'

또는 간단한 루프로:

for name in ligand_*/out.pdbqt; do
    grep -F 'REMARK VINA RESULT' "$name" | head -n 1
done

저는 여기서 다양한 방법을 사용했는데, 가장 자연스럽게 느껴지는 방법을 선택하세요.

Answer

$ awk -F: '$1 != p && /RESULT/ { print; p = $1 }' file
ligand_06278/out.pdbqt:REMARK VINA RESULT:      -8.3      2.094      2.612
ligand_06279/out.pdbqt:REMARK VINA RESULT:      -6.1      9.841     13.115
ligand_06280/out.pdbqt:REMARK VINA RESULT:     -10.0      3.811      7.264