eurekafag
18.12.2010 20:09 Home
Внезапно, взбрела мысль, что на питоне наверняка есть фреймворк для создания грабилок со свистоперделками. Быстрый гуглинг выдал вот это: http://doc.scrapy.org/intro/overview.htm... (сразу пример использования). Кто щупал, как оно? Не хочется велосипедить.

11 comments
recommend
bookmark
subscribe
но зачем питон для парсеров? есть же перл
Но зачем насиловать труп?
Нене, перл для парсеров рулит. Скорость раза в 4 выше
Сдаётся мне, в случае с кравлером скорость парсинга вообще далеко не бутылочное горло. Я же не гугл с гигабитным каналом.
По сути, это единственное оправданное его применение сейчас.
Ну, регэкспы няшно писать еще, да.
Ради одного применения учить инопланетный язык? Да ну нахуй, НЕ НУЖНО. Питон вполне неплохо с этим справится, а регекспами XML парсить — моветон.
для xml есть модули. Кто парсит их вручную?
Я и говорю, регекспы для XML не нужны.
что-то я не понял, в чем профит этого фреймворка. По моему, можно взять красивосуп и сделать то же самое, не намного больше кода нужно.
Ну там внизу WHAT ELSE MUTHAFUKKA, почитай. Суп делает чисто парсинг, а тут свистоперделки ещё и мидловарь.