얘들아
이전에 이런 질문을 드려서 죄송하지만 한번 시도해 보겠습니다.
다음 형식의 테이블(탭으로 구분된 텍스트 파일)이 있습니다.
Species1 Species2 Species3
Gene 1 Value Value Value
Gene 2 Value Value Value
Gene 3 Value Value Value
.
.
.
다음 형식으로 변경해야 합니다.
Gene 1 Species 1 Value
Gene 2 Species 1 Value
Gene 3 Species 1 Value
.
.
.
Gene 1 Species 2 Value
Gene 2 Species 2 Value
Gene 3 Species 2 Value
.
.
.
etc.
이를 수행하는 특정 유닉스 명령이 있습니까? 아니면 엑셀에서 바로 할 수 있나요? 테이블에는 거의 120,000개의 데이터 포인트가 있으므로 이 작업을 수동으로 수행하는 것은 불가능하다고 생각합니다.
아마 아시겠지만 저는 이런 일에 대해 전문가는 아닙니다.
미리 감사드립니다.
답변1
자세히 살펴봐야 해얼어서 고움. Numpy는 원하는 방식으로 행렬을 구성하는 데 도움이 되는 매우 강력한 도구입니다.
다음 예를 살펴보십시오.
>>> import numpy as np
>>> a = np.array([[1, 2, 3], [4, 5,6]])
>>> a
array([[1, 2, 3],
[4, 5, 6]])
>>> a.transpose()
array([[1, 4],
[2, 5],
[3, 6]])
csv 또는 txt와 같은 데이터 파일에서 numpy로 데이터를 가져올 수도 있습니다.
np.genfromtxt('path/to/myfile.csv',delimiter=',',skiprows=1)
사용 중인 데이터 스타일이 무엇인지 명확하게 설명하지 않기 때문에 실제로 필요한 것을 찾기는 어렵지만 시작하는 데는 도움이 됩니다.
numpy에 익숙해지면 더 깊이 파고들 수도 있습니다.팬더.