der_FeniX 14.11.2011 13:34

Питоно-пстач, что за фигня?
print page — выводит всю страницу целиком

import lxml.html as html
page = html.fromstring(page)
print html.tostring(page) — выводит только всё, кроме body. соответсвенно и len(html.xpath('/html/body')) == 0

1. arts 14.11.2011 13:35

page = html.fromstring(str(page)) попробуй.

2. der_FeniXarts /1 14.11.2011 13:38

не помогло.
.....
</head></html>

3. der_FeniX 14.11.2011 13:39

выкусывает нафиг <body></body> и всё тут.

4. der_FeniX 14.11.2011 13:59

Изврат, конечно, но пока сделал так:
page = BeautifulSoup(page).prettify()
page = html.fromstring(page)
Распарсило нормально

Do you really want to delete ?