der_FeniX
14.11.2011 13:34
Питоно-пстач, что за фигня?
print page — выводит всю страницу целиком
import lxml.html as html
page = html.fromstring(page)
print html.tostring(page) — выводит только всё, кроме body. соответсвенно и len(html.xpath('/html/body')) == 0
page = html.fromstring(str(page)) попробуй.
не помогло.
.....
</head></html>
выкусывает нафиг <body></body> и всё тут.
Изврат, конечно, но пока сделал так:
page = BeautifulSoup(page).prettify()
page = html.fromstring(page)
Распарсило нормально