eurekafag 18.12.2010 20:09 Home

Внезапно, взбрела мысль, что на питоне наверняка есть фреймворк для создания грабилок со свистоперделками. Быстрый гуглинг выдал вот это: http://doc.scrapy.org/intro/overview.htm... (сразу пример использования). Кто щупал, как оно? Не хочется велосипедить.

1. SirAnthony 18.12.2010 20:10 Home

но зачем питон для парсеров? есть же перл

2. eurekafagSirAnthony /1 18.12.2010 20:10 Home

Но зачем насиловать труп?

3. SirAnthonyeurekafag /2 18.12.2010 20:10 Home

Нене, перл для парсеров рулит. Скорость раза в 4 выше

4. eurekafagSirAnthony /3 18.12.2010 20:11 Home

Сдаётся мне, в случае с кравлером скорость парсинга вообще далеко не бутылочное горло. Я же не гугл с гигабитным каналом.

5. SirAnthonySirAnthony /3 18.12.2010 20:11 Home

По сути, это единственное оправданное его применение сейчас.

6. SirAnthonyeurekafag /4 18.12.2010 20:12 Home

Ну, регэкспы няшно писать еще, да.

7. eurekafagSirAnthony /5 18.12.2010 20:12 Home

Ради одного применения учить инопланетный язык? Да ну нахуй, НЕ НУЖНО. Питон вполне неплохо с этим справится, а регекспами XML парсить — моветон.

8. SirAnthonyeurekafag /7 18.12.2010 20:13 Home

для xml есть модули. Кто парсит их вручную?

9. eurekafagSirAnthony /8 18.12.2010 20:14 Home

Я и говорю, регекспы для XML не нужны.

10. SirAnthonyeurekafag /9 18.12.2010 20:18 Home

что-то я не понял, в чем профит этого фреймворка. По моему, можно взять красивосуп и сделать то же самое, не намного больше кода нужно.

11. eurekafagSirAnthony /10 18.12.2010 20:19 Home

Ну там внизу WHAT ELSE MUTHAFUKKA, почитай. Суп делает чисто парсинг, а тут свистоперделки ещё и мидловарь.

Do you really want to delete ?