빅 데이터를 처리하기 위해 배치 모드에서 프로그램을 실행하는 방법은 무엇입니까?

Question

함수를 정의하거나 하나의 인수만 취하는 스크립트를 작성하세요..pamlcodeml파일 또는 이름에 고유 번호가 있으며 래퍼를 구성하여 호출됩니다..ctl매개변수 파일에 따라 템플릿이 변경되지 않습니다.codeml.ctl문서:

function mycodeml(){
  num="${1//[^0-9]/}" # keep only numbers
  if [ !-f OG$num.paml ] ;then
    echo ERR NOTFOUND $PWD/OG$num.paml >&2
  else
    tmp=$(mktemp /tmp/codeml_XXX.ctl)
    sed "s/OG[0-9]*\(.paml\|.treefile\|_out.paml\)/OG$num\1/g" codeml.ctl >$tmp &&
    codeml $tmp
    rm $tmp
  fi
}

그럼 당신은 실행할 수 있습니다mycodeml OGxxx.paml

여러 항목을 한 번에 일괄 처리하려면 ls해당 항목을 사용하고 수집하여 grep다음 위치에 삽입하세요 xargs.

ls | grep 'OG[0-9]*.paml' | xargs -l1 mycodeml

또는 병렬화:

ls | grep 'OG[0-9]*.paml' | parallel mycodeml

Answer 1

함수를 정의하거나 하나의 인수만 취하는 스크립트를 작성하세요..pamlcodeml파일 또는 이름에 고유 번호가 있으며 래퍼를 구성하여 호출됩니다..ctl매개변수 파일에 따라 템플릿이 변경되지 않습니다.codeml.ctl문서:

function mycodeml(){
  num="${1//[^0-9]/}" # keep only numbers
  if [ !-f OG$num.paml ] ;then
    echo ERR NOTFOUND $PWD/OG$num.paml >&2
  else
    tmp=$(mktemp /tmp/codeml_XXX.ctl)
    sed "s/OG[0-9]*\(.paml\|.treefile\|_out.paml\)/OG$num\1/g" codeml.ctl >$tmp &&
    codeml $tmp
    rm $tmp
  fi
}

그럼 당신은 실행할 수 있습니다mycodeml OGxxx.paml

여러 항목을 한 번에 일괄 처리하려면 ls해당 항목을 사용하고 수집하여 grep다음 위치에 삽입하세요 xargs.

ls | grep 'OG[0-9]*.paml' | xargs -l1 mycodeml

또는 병렬화:

ls | grep 'OG[0-9]*.paml' | parallel mycodeml

빅 데이터를 처리하기 위해 배치 모드에서 프로그램을 실행하는 방법은 무엇입니까?

배치 모드에서

답변1

관련 정보