텍스트 파일에서 제품, 번호 및 수량 추출

텍스트 파일에서 제품, 번호 및 수량 추출

내 텍스트 파일이 올바르지 않습니다. 여기에 제품 이름, 웹사이트 위치, 수량 등이 포함되어 있습니다. 이제 제품명, 번호(URL에서 추출), 수량만 준비하고 싶습니다.

입력 파일:

rawfile.txt

Component name  Link    Quantity
Ba Test Con - Red   https://kr.element14.com/multicomp/a-1-126-n-r/banana-plug-16a-4mm-cable-red/dp/1698969 25
Ban Te Con - Black  https://kr.element14.com/multicomp/a-1-126-n-b/plug-16a-4mm-cable-black/dp/1698970  25
Ban Te Con - Black  https://kr.element14.com/hirschmann-testmeasurement/930103700/socket-4mm-black-5pk-mls/dp/1854599   15

예상 출력:

Ba Test Con - Red   1698969 25
Ban Te Con - Black  1698970 25
Ban Te Con - Black  1854599 15

내 코드:

For product name:
# extract product name
grep '.*?(?=https://)' rawfile.txt

# extract product number
grep -Po '\b[0-9]{6,7}\t\b' rawfile.txt

# extract quanity
grep -Po '\t[0-9]{1,3}' rawfile.txt

# Now combining the last two functions into one ; this works
# grep -Po '(number argument)(quantity argument)' rawfile.txt
grep -Po '(\b[0-9]{6,7}\t\b)(\t[0-9]{1,3})' rawfile.txt
1698969 25
1698970 25
1854599 15
# Now combining the three functions into one and producing an output text file; this works
# grep -Po '(product name argument)(number argument)(quantity argument)' rawfile.txt
grep -Po '(.*?(?=https://))(\b[0-9]{6,7}\t\b)(\t[0-9]{1,3})' rawfile.txt

현재 출력:

>> grep -Po '(.*?(?=https://))(\b[0-9]{6,7}\t\b)(\t[0-9]{1,3})' rawfile.txt
>>                      # no output

답변1

이렇게 간단한 일이 이루어질까요? (개선될 수 있지만 요점을 알 수 있습니다)

$ cat test.txt 
Ba Test Con - Red   https://kr.element14.com/multicomp/a-1-126-n-r/banana-plug-16a-4mm-cable-red/dp/1698969 25
Ban Te Con - Black  https://kr.element14.com/multicomp/a-1-126-n-b/plug-16a-4mm-cable-black/dp/1698970  25
Ban Te Con - Black  https://kr.element14.com/hirschmann-testmeasurement/930103700/socket-4mm-black-5pk-mls/dp/1854599   15

$ sed 's#https://.*/##' test.txt 
Ba Test Con - Red   1698969 25
Ban Te Con - Black  1698970  25
Ban Te Con - Black  1854599   15

관련 정보