gawk

awk를 사용하여 여러 필드 연결
gawk

awk를 사용하여 여러 필드 연결

다음과 같이 file1이 있습니다. 2010,92614,0,1 2010,92614,4,1 file2는 다음과 같습니다. 2010,0,907894 2010,1,17788 2010,2,2827 2010,3,1212 2010,4,669914 file1의 필드 1과 3, file2의 필드 1과 2에서 두 파일을 결합하고 싶습니다(예를 들어 두 파일의 첫 번째 레코드는 2010과 0임). 출력은 다음과 같아야 합니다. 2010,92614,0,1,907894 2010,92614,4,1,669914 즉, 행...

Admin

빈 열이 있는 경우 열을 여러 열로 분할
gawk

빈 열이 있는 경우 열을 여러 열로 분할

다음과 관련해 도움이 필요합니다. A B C 1 2 Q W A 빈 열을 찾을 때마다 해당 열을 새 열로 분할합니다. 산출: A,1,Q B,2,W C,,A Sed를 사용했는데 분할할 키워드를 찾을 수 없습니다. 데이터가 너무 많아서 효율적으로 처리할 수 있는 방법이 없을까요? 감사해요 ...

Admin

awk는 마지막 레코드와 일치하여 인쇄합니다.
gawk

awk는 마지막 레코드와 일치하여 인쇄합니다.

내가 얻은 기록은 다음과 같습니다 fileinp. 1 ABCDEFGHILM 12345678901234567 ABCD X 1 CDEFGHILMNO 34567890123456789 BCDE Y 1 EFGHILMNOPQ 56789012345678901 CDEF Z 1 GHILMNOPQRS 78901234567890123 DEFG W 마지막 문자가 Y 또는 Z이면 문자 1...

Admin

검색 패턴 파일을 사용하여 CSV의 마지막 열에서 정확한 단어를 검색하려면 어떻게 해야 합니까?
gawk

검색 패턴 파일을 사용하여 CSV의 마지막 열에서 정확한 단어를 검색하려면 어떻게 해야 합니까?

이 문제는 별도의 주제로 논의되지만 모든 내용을 하나로 통합할 수는 없습니다. TSV 파일이 있습니다. 다음은 샘플 라인입니다: (file1) NODE_1_length_45927_cov_22.029055_g0_i0 WP_055195622.1 93.1 729 50 0 291 2477 1 729 0.0e+00 1275.4 166486;1897048 마지막 필드에는 로 구분된 숫자 목록이 포함됩니다 ;. 검색 패턴 목록이 포함된 파일(파일...

Admin

gawk를 사용하여 CSV 파일에 조건부로 새 헤더를 도입하는 방법
gawk

gawk를 사용하여 CSV 파일에 조건부로 새 헤더를 도입하는 방법

csv 파일이 있는데 열 번호만 추출하고 싶습니다.7그리고11. 열 7(해당 열에 값이 있음)의 값에 따라 OK또는 그 옆에 열( 맵 위치 KO라고 함)을 삽입하고 싶습니다 .value OK -> 0 KO -> 1 또한 시작 부분에 간단한 문자열 열을 추가했습니다. 내 .awk파일은 다음과 같습니다. BEGIN {FS=";";OFS=","} { value=0 if($7=="KO") { value=1 } print "Measure_QS",$7,va...

Admin

awk를 사용하여 두 파일을 병합하고 한 파일의 마지막 줄을 건너뜁니다.
gawk

awk를 사용하여 두 파일을 병합하고 한 파일의 마지막 줄을 건너뜁니다.

두 파일을 연결하고 중복된 헤더 줄을 제거하고 마지막 줄만 가져오려고 합니다. 예를 들어: 파일 1.txt head1 data1 data2 tail8 파일 2.txt head1 data3 data4 tail9 file3.txt에서 원하는 결과: head1 data1 data2 data3 data4 tail8 or rail9 doesn't matter 먼저 중복 헤더를 제거해 보았습니다. awk '!seen[$0]++' file1.txt file2.txt > file3.txt 두 번째 명령은...

Admin

awk: env 파일의 키 값을 인쇄하는 방법은 무엇입니까?
gawk

awk: env 파일의 키 값을 인쇄하는 방법은 무엇입니까?

내가 시도한 내용은 다음과 같습니다(몇 가지 다른 반복과 함께). 파일의 조각 APOLLO_KEY=service:abcd cat packages/graph/.env | gawk '{ if ($0 = "APOLLO_KEY" ) { RS = "=" } ; { print $1 } }' APOLLO_KEY대신 파일의 각 줄 값을 반환합니다 . 내가 기대하고 얻고 싶은 가치는 service:abcd 이런 식으로 파일을 구문 분석하는 데 상당한 문제가 있다는 것을 알고 있습니다. 나는 단지 일회성 명령을 ...

Admin

Unix 명령을 사용하여 정렬 URL 정규식 구현
gawk

Unix 명령을 사용하여 정렬 URL 정규식 구현

저는 sed, awk, sort, grep 및 기타 Unix 바이너리에 구현된 정규 표현식을 처음 사용합니다. 텍스트 편집기(BBEdit)에서 URL 목록을 정렬하기 위해 다음 정규 표현식을 사용하면 다음과 같은 사실을 알고 있습니다. (https?)://([a-z0-9]+[.])*(.+?)[.](.+?)/(.*)$ \3\t\4\t\2\t\5\t\1 내가 원하는 최종 결과가 나왔습니다. BBEdit의 GUI에서 정렬을 실행하지 않고도 자동으로 수행할 수 있도록 Unix 명령줄에서 이 정렬을 수행하고...

Admin

특정 키워드가 일치하는 경우 테이블의 여러 열 값 변경
gawk

특정 키워드가 일치하는 경우 테이블의 여러 열 값 변경

다음 형식의 데이터가 있습니다. 38%,1,0,0 32%,400,376.61,94.1525 54%,400,197,49.25 22%,1,1,100 두 번째 열이 1이면 두 번째, 세 번째, 네 번째 열을 NA로 변경합니다. 38%,NA,NA,NA 32%,400,376.61,94.1525 54%,400,197,49.25 22%,NA,NA,NA 먼저 하나의 열을 교체하려고 시도했지만 작동하지 않습니다. awk -F, '$2==1 {$2="NA"}1' OFS=, ...

Admin

정규식이 나타날 때마다 파일을 분할하는 방법은 무엇입니까?
gawk

정규식이 나타날 때마다 파일을 분할하는 방법은 무엇입니까?

단락에 "7-04/PNLP-000001" 형식의 코드가 포함될 때마다 텍스트 파일을 별도의 파일로 분할하도록 gawk를 시도하고 있습니다. 예를 들어 원본 텍스트 파일에 다음 내용이 포함되어 있는 경우: Seville-Córdoba-Madrid Avenue와 관련된 Proposición no de Ley 7-04/PNLP-000009. 안달루시아 농촌 지역 중년 근로자의 재활 및 사회 발전에 관한 Ley 대통령 부인 의 제안 7-04/PNLP-000001. 대통령의 아내 다음을 포함하는 파일...

Admin

gawk를 사용하여 CSV 열 데이터를 기반으로 파일 이름 만들기
gawk

gawk를 사용하여 CSV 열 데이터를 기반으로 파일 이름 만들기

다음과 같은 헤더가 포함된 매우 지저분한 CSV 파일이 있습니다. maindata.csv time;area;measurement1;measurement2;measurement3;.....measurement12 gawk각 개별 파일을 다음 CSV 형식으로 유지하기 위해 다음 명령 형식을 사용하여 측정 이름을 기반으로 하나의 대용량 파일을 개별적으로 분할 할 수 있었습니다 . measurement1.csv -> has csv header [time,area,measurement1] measure...

Admin

awk를 사용하여 환율/"파생상품" 계산
gawk

awk를 사용하여 환율/"파생상품" 계산

awk여기 초보자입니다. 두 개의 데이터 열이 있고 delta(y)/delta(x)로 제공되는 성장률을 계산한다고 가정합니다. awk스크립트에서 이 작업을 어떻게 수행합니까 ? 지금까지 배운 내용은 한 줄씩 작업하는 것뿐이어서 여러 줄을 처리하는 방법을 잘 모르겠습니다. 참고: N개의 데이터 포인트가 있다고 가정하면 N-1개의 기울기/속도 값을 얻게 됩니다. 예: 입력하다 x y 2 4 3 5 4 7 산출 Slope - 1 2 이것이 awk최선의 선택입니까? 아니면 다른 도구...

Admin

GNU awk 구현 제한이 실제로 작동하지 않는 것처럼 보이는 이유는 무엇입니까?
gawk

GNU awk 구현 제한이 실제로 작동하지 않는 것처럼 보이는 이유는 무엇입니까?

이 페이지GNU awk 구현 제한에 관해서는 필드 크기 및 리터럴 문자열 크기에 대한 제한이 언급되어 있습니다 MAX_INT. 그러나 긴 문자열 리터럴을 변수로 선언하고 함수를 사용하여 길이를 찾으려고 하면 length문자열 길이가 308자를 초과하면 함수가 중단되는 것 같습니다. 아래 예: BEGIN { avar=1234... #309 characters print length(avar) #prints 3 but prints right length when length < 309 }...

Admin

이스케이프 문자와 gsub를 사용하지 않고 텍스트 앞에 따옴표를 가져와야 합니다.
gawk

이스케이프 문자와 gsub를 사용하지 않고 텍스트 앞에 따옴표를 가져와야 합니다.

tst.csv다음 내용으로 이름이 지정된 파일이 있습니다 "FORESS INTL PTN "A" (208)" 다음 출력을 얻으려면 이스케이프 문자( \) 를 사용해서는 안 되며 gsub/는 sub다음 예상 출력을 달성하는 데만 필요합니다. 사용 중인 외부 프로그램은 백슬래시 문자를 디코딩하지 않기 때문입니다. 예상 출력 "FORESS INTL PTN ""A"" (208)" 다음 명령을 시도했습니다 awk '{gsub(/"/,"&&");gsub(/^""|""$/,"")}1' ...

Admin