나는 최근에야 이 라이브러리를 발견했는데 첫 번째 영향은 전혀 즐겁지 않았습니다! 우선 이 홈페이지에서https://lxml.de/나는 당신에 대해 모르지만 아무것도 이해하지 못합니다! 너무 복잡하고 헷갈리네요... 공부하면서 이미 알고 계시는 것처럼 말씀드리는 거에요! 패키지된 예제는 이해하기 어렵고 일부 측면에서는 매우 피상적인 설명을 포함합니다. 이를 위해 나는 두 가지를 요청합니다.
첫 번째:
혹시 좋은 자료가 있는 사이트 아시면 알려주시면 감사하겠습니다.
두번째:
내 주요 목적은 단지 구문 분석하는 것입니다하이퍼텍스트 마크업 언어(아니다XML)원천. 그 튜토리얼(그리고 다른 많은 것)에서 나는 그들이 모두 사용하는 것을 보았습니다.나무( lxml.etree
) 그리고HTML( lxml.html
) 방법... 둘 사이에는 어떤 변화가 있나요? 아직은 잘 이해가 안 되기 때문에...
내 영어로 고맙고 미안해
답변1
Python으로 HTML을 구문 분석하려면 다음을 사용하십시오.아름다운 수프`대신에. HTML은 제대로 작동하는 형식이 아니며 XML 파서를 사용하는 것은 작동하지 않을 가능성이 높습니다.