카테고리에 따라 무작위로 텍스트 파일을 반으로 나눕니다.

Question

카테고리에 따라 파일을 분할하고 개별 부분에 대해 작업하는 것이 마음에 들지 않으면 다음을 수행할 수 있습니다.

split -l 500 -a 3 infile
rnd=( $(printf %s\\n x??? | shuf -n 100) )
cat "${rnd[@]}" > rand1
rm "${rnd[@]}"
cat x??? > rand2
rm x???

이는 split파일을 각각 500줄로 구성된 200개의 조각으로 분할하고(즉, 카테고리당 하나의 조각) shuf파일 이름을 배열에 저장하여 무작위로 100개의 조각을 선택합니다 rnd. 그런 다음 배열에 나열된 조각을 에 병합하여 rand1삭제하고 나머지 조각을 에 병합하여 rand2삭제합니다. 이 솔루션에서는 파일의 행이 범주별로 그룹화되어 있으며 x???현재 디렉터리에서 일치하는 유일한 파일 이름은 split명령으로 생성된 파일 이름이라고 가정합니다.

Answer 1

카테고리에 따라 파일을 분할하고 개별 부분에 대해 작업하는 것이 마음에 들지 않으면 다음을 수행할 수 있습니다.

split -l 500 -a 3 infile
rnd=( $(printf %s\\n x??? | shuf -n 100) )
cat "${rnd[@]}" > rand1
rm "${rnd[@]}"
cat x??? > rand2
rm x???

이는 split파일을 각각 500줄로 구성된 200개의 조각으로 분할하고(즉, 카테고리당 하나의 조각) shuf파일 이름을 배열에 저장하여 무작위로 100개의 조각을 선택합니다 rnd. 그런 다음 배열에 나열된 조각을 에 병합하여 rand1삭제하고 나머지 조각을 에 병합하여 rand2삭제합니다. 이 솔루션에서는 파일의 행이 범주별로 그룹화되어 있으며 x???현재 디렉터리에서 일치하는 유일한 파일 이름은 split명령으로 생성된 파일 이름이라고 가정합니다.

카테고리에 따라 무작위로 텍스트 파일을 반으로 나눕니다.

답변1

관련 정보