하위 문자열 추출

Question 1

입력의 공백이 탭이고 출력도 탭으로 구분되기를 원한다고 가정합니다.

$ awk -F'[\t=;]' -v OFS='\t' '{print $1, $10, $4, $5}' file
Nt01    Nitab4.5_0006317g0010.1 143295  155540
Nt01    Nitab4.5_0006317g0020.1 170633  173860

Answer

입력의 공백이 탭이고 출력도 탭으로 구분되기를 원한다고 가정합니다.

$ awk -F'[\t=;]' -v OFS='\t' '{print $1, $10, $4, $5}' file
Nt01    Nitab4.5_0006317g0010.1 143295  155540
Nt01    Nitab4.5_0006317g0020.1 170633  173860

Question 2

옮기다GNU sed확장된 정규식 지원 -E:

# field construction helper variables
t=$'\t'; T="[^$t]"; F=$T+$t
F2=$F$F; F3=$F2$F; FT=$F$T+

# use the helper variables in rearranging
# and pruning the pattern space
sed -Ee "
  s/^($F)$FT($t$FT)$t${F3}ID=([^;]*);.*/\1\3\2/
" file.tsv

결과:

Nt01    Nitab4.5_0006317g0010.1 143295  155540
Nt01    Nitab4.5_0006317g0020.1 170633  173860

Answer

옮기다GNU sed확장된 정규식 지원 -E:

# field construction helper variables
t=$'\t'; T="[^$t]"; F=$T+$t
F2=$F$F; F3=$F2$F; FT=$F$T+

# use the helper variables in rearranging
# and pruning the pattern space
sed -Ee "
  s/^($F)$FT($t$FT)$t${F3}ID=([^;]*);.*/\1\3\2/
" file.tsv

결과:

Nt01    Nitab4.5_0006317g0010.1 143295  155540
Nt01    Nitab4.5_0006317g0020.1 170633  173860

하위 문자열 추출

답변1

답변2

관련 정보