군집 분석을 위해 PDL 사용 시작 PDL::Stats::Kmeans

군집 분석을 위해 PDL 사용 시작 PDL::Stats::Kmeans

첫 번째 질문은 "펄 데이터 언어가 죽었나요?"입니다. 활발한 토론이나 사용자 Q&A를 찾지 못했습니다.

더 나은 태그를 지정하지 않아서 죄송합니다. 담당자가 없습니다.'

내 문제 영역은 전원 스위칭 이벤트를 분석하고 반응성 및 저항성 부하의 판독값을 다시 연결하여 공장 하드웨어의 특정 항목을 가리키는 것입니다.

그래서 클러스터 분석을 생각하고 PDL로 옮겼습니다.

내가 쓴 Perl 스크립트에서

use PDL::Stats::KMeans;
my $sql = "select resistv_chg,reactv_chg from metered_events where matched_event_id is not null";
my $pdl = rdbi2D( $dbh, $sql );  # pdl info tells me that i have a 2D array of 1400 x 2
my $k = $pdl->kmeans( {} );

Perldebug에서 kmeans()에 대한 호출을 실행하면 일련의 출력이 시작됩니다. 이 모든 것은 나에게 아무 의미가 없습니다. 설치를 고려하면 요즘 약 10~15명의 서로 다른 사람들 클러스터가 예상됩니다. PDL에 대해 어떻게 생각하시나요? 더 나은 도구 선택이 있습니까?

답변1

보시다시피문서, 기본적으로 3개의 클러스터가 발견됩니다. 10개의 클러스터를 찾고 있다면 다음이 필요합니다.

my $k = $pdl->kmeans( {NCLUS => 10} );

PDL을 사용한 k-평균에 대한 짧은 블로그 게시물 시리즈가 있습니다.여기서부터 시작해.

Perl은 매우 활동적이며 PDL의 새 버전이 매달 출시되지만 트래픽이 더 많습니다.스택 오버플로,IRC와 메일링 리스트.

관련 정보