eurekafag
18.12.2010 20:09 Home
Внезапно, взбрела мысль, что на питоне наверняка есть фреймворк для создания грабилок со свистоперделками. Быстрый гуглинг выдал вот это: http://doc.scrapy.org/intro/overview.htm... (сразу пример использования). Кто щупал, как оно? Не хочется велосипедить.
но зачем питон для парсеров? есть же перл
Но зачем насиловать труп?
Нене, перл для парсеров рулит. Скорость раза в 4 выше
Сдаётся мне, в случае с кравлером скорость парсинга вообще далеко не бутылочное горло. Я же не гугл с гигабитным каналом.
По сути, это единственное оправданное его применение сейчас.
Ну, регэкспы няшно писать еще, да.
Ради одного применения учить инопланетный язык? Да ну нахуй, НЕ НУЖНО. Питон вполне неплохо с этим справится, а регекспами XML парсить — моветон.
для xml есть модули. Кто парсит их вручную?
Я и говорю, регекспы для XML не нужны.
что-то я не понял, в чем профит этого фреймворка. По моему, можно взять красивосуп и сделать то же самое, не намного больше кода нужно.
Ну там внизу WHAT ELSE MUTHAFUKKA, почитай. Суп делает чисто парсинг, а тут свистоперделки ещё и мидловарь.