다음과 같은 탭으로 구분된 데이터가 있습니다.
데이터 세트 | ID | 값 |
---|---|---|
ㅏ | 1 | 10 |
ㅏ | 2 | 20 |
ㅏ | 삼 | 30 |
두번째 | 1 | 40 |
두번째 | 2 | 50 |
두번째 | 삼 | 60 |
다음과 같이 변환하고 싶습니다.
ID | ㅏ | 두번째 |
---|---|---|
1 | 10 | 40 |
2 | 20 | 50 |
삼 | 30 | 60 |
저는 r과 python에서 이 작업을 수행하는 방법을 알고 있지만 이것은 ~600개의 서로 다른 데이터 세트와 ~30,000개의 서로 다른 ID를 포함하는 매우 큰 파일입니다.
시간을 내어 도움을 주셔서 감사합니다.
답변1
그것을 발견.
datamash crosstab 2,1 unique 3 < input.tsv > output.tsv