GNU Recode - 혼합 HTML 문자/숫자 인코딩 텍스트를 올바르게 디코딩합니까?

2024-6-9 • tag-icon

저는 최근에 GNU 재인코딩을 사용하여 HTML 엔터티를 디코딩할 수 있다는 사실을 발견했습니다. 그러나 악성 코드를 살펴보면 이것이 혼합된 HTML 문자/엔티티 인코딩인 것처럼 보입니다. 악성 도메인의 URL을 example.com으로 변경했습니다.

https&colon;//example&period;com/

파이프하면 recode html..ascii다음과 같은 결과가 나오며 숫자 엔터티는 디코딩되지만 문자 엔터티는 디코딩되지 않습니다.

https&colon;//example&period;com/

처리되는 형식에 대한 좋은 문서를 찾지 못했습니다 recode. 문자 엔터티를 디코딩하는 두 번째 단계를 수행할 수 있는 방법이 있습니까? 아니면 디코딩하는 데 사용할 수 있는 더 나은 cli 도구가 있습니까?

관련 정보