실제 표현으로 변환하려는 유효한 C 문자열 리터럴이 있습니다. 불행하게도 printf의 %b 변환 지정자는 C 문자열에서 유효한 ? 이스케이프 문자 ' 및 "를 정의하지 않습니다.
지금은 변환을 수행하는 작은 C 프로그램이 있지만 표준 POSIX 도구를 사용하여 모든 작업을 수행할 수 있기를 바랍니다.
POSIX 도구(GNUisms 없음)에서만 작동하고 필요할 경우 bash를 수행할 수도 있지만 sh가 선호됩니다.
답변1
저는 awk에서 이 작업을 수행할 수 있는 방법을 생각해 냈습니다. 하지만 조금 보기 흉하기 때문에 누구든지 더 나은 솔루션을 갖고 있다면 관심을 가질 것입니다. 이는 모든 유효한 C 문자열에 대해 작동하지만 유효하지 않은 문자열의 모든 경우를 처리하지는 않습니다(예: \q, 여기서 q는 백슬래시 다음에 오는 유효하지 않은 문자이며 해당 문자만 사용합니다).
function hexnumber(str, ret, n, k)
{
n = length(str)
ret = 0
for (i = 1; i <= n; i++) {
c = substr(str, i, 1)
c = tolower(c)
# index() returns 0 if c not in string,
# includes c == "0"
k = index("123456789abcdef", c)
ret = ret * 16 + k
}
return ret;
}
function octnumber(str, ret, n, k)
{
n = length(str)
ret = 0
for (i = 1; i <= n; i++) {
c = substr(str, i, 1)
# index() returns 0 if c not in string,
# includes c == "0"
k = index("1234567", c)
ret = ret * 8 + k
}
return ret;
}
BEGIN { RS="\\" ; notQuoted = 0}
#{ print $0 ; next}
NR == 1 {
if(match($0,/^"/)) {
split($0,matches,"\"")
printf("%s",matches[2]);
if(match($0,/^"[^"]*"/)) {
exit 0;
}
next
} else {
exit 1;
}
}
#This will happen on the 2nd (and subsequent) consecutive backslash
/^$/ {
if (notQuoted) {
notQuoted = 0
} else {
notQuoted = 1
printf("\\")
next
}
}
notQuoted == 1 {
if(match($0,/([^"]*)"/))
{
split($0,matches,"\"")
printf("%s",matches[1])
exit 0
}
printf("%s",$0);
next
}
# If we reach here, then the first character is part of a backslash escape
{
first = substr($0,1,1);
rest = substr($0,2);
if(first == "a") printf("\a")
else if(first == "b") printf("\b")
else if(first == "f") printf("\f")
else if(first == "n") printf("\n")
else if(first == "r") printf("\r")
else if(first == "t") printf("\t")
else if(first == "v") printf("\v")
else if(first == "\"") printf("\"")
else if (first == "x") {
second = substr(rest,1,1);
third = substr(rest,2,1);
if(match(third,/[1234567890ABCDEFabcdef]/)) {
printf("%c",hexnumber(second third)+0);
rest = substr(rest,3);
}
else {
printf("%c",hexnumber(second)+0);
rest = substr(rest,2);
}
}
else if (match(first,/[01234567]/)) {
second = substr(rest,1,1);
third = substr(rest,2,1);
fourth = substr(rest,3,1);
if(match(second third fourth,/^[01234567]*$/)) {
printf("%c",octnumber("0" first second third fourth)+0);
rest = substr(rest,length(first second third fourth));
}
else if(match(second third,/^[01234567]*$/)) {
printf("%c",octnumber(first second third)+0);
rest = substr(rest,length(first second third));
}
else if(match(second,/^[01234567]*$/)) {
printf("%c",octnumber(first second)+0);
rest = substr(rest,length(first second));
}
else {
printf("%c",octnumber(first)+0);
}
}
if(match(rest,/([^"]*)"/)) # this comment fixes vim's syntax matching "
{
split(rest,matches,"\"")
printf("%s",matches[1])
exit 0
}
printf("%s",rest);
}