아무 표시 없이 정렬이 중단되는 것 같습니다.

아무 표시 없이 정렬이 중단되는 것 같습니다.

제가 틀렸다면 정정해 주세요. 하지만 이는 Apache Jena나 Linux용 Windows 하위 시스템보다 Unix에 더 많이 적용된다고 생각합니다. 결국 이는 sort로그 없이 사라지는 것처럼 보이는 유틸리티입니다.

자세한 과정을 밟고 있어요여기Wiki 데이터를 로컬 Apache Jena 인스턴스로 가져옵니다. 저는 Windows 10의 Linux 하위 시스템에서 Ubuntu 20.04를 사용하고 있습니다.

데이터 단계(데이터 가져오기)는 잘 작동하지만 인덱스 단계(이봐) 항상 알림 없이 충돌이 발생합니다. 세부사항은 다음과 같습니다:

bash에서 이 스크립트를 실행하고 있습니다( --phase data성공적으로 완료한 후).

apache-jena-3.15.0/bin/tdbloader2 --phase index --loc data/  > tdb1.log 2> tdb2.log &

그러면 tdb1.log에 다음 네 개의 로그 항목이 기록됩니다.

 12:09:02 INFO -- TDB Bulk Loader Start
 12:09:02 INFO Index Building Phase
 12:09:02 INFO Creating Index SPO
 12:09:02 INFO Sort SPO

이 스크립트는 sort내부적으로 사용됩니다. 실제로 명명된 프로세스는 sort약 20분 동안 실행되며 약 15GB의 메모리를 사용합니다. 그 이후에는 별도의 로그 생성 없이 해당 프로세스가 사전 통지 없이 사라집니다.

제 질문은 충돌의 원인을 어떻게 찾을 수 있느냐는 것입니다. sort일종의 충돌 지침이나 사후 분석이 작성 되어야 하지 않나요 ?

도움이 된다면,예나 문서설명하다

빌드의 인덱싱 단계에서는 정렬 유틸리티를 사용하여 인덱싱을 위한 원시 데이터를 준비합니다. 이렇게 하려면 많은 디스크 공간이 필요할 수 있으며, 디스크 공간이 부족한 것으로 나타나면 스크립트가 자동으로 확인하고 경고/중단합니다.

이 경고는 어디서 볼 수 있나요? 아니요, 디스크 여유 공간이 100GB가 넘으니 이것이 직접적인 원인은 아닌 것 같습니다.

답변1

출력에서 오류가 발견되었습니다 tdb2.log( 2>파이프 연산자 오류).

결과적으로 sort디스크 공간이 부족합니다.

관련 정보