eoranged 10.08.2011 18:40 Pidgin

В общем, вот регулярка, которой можно парсить посты, приходящие через бота:
^@([\w\-]{2,})\s?(?:→\s?@([\w\-]{2,}))?\:\n(?:\*([^\n]+)(?:\n|\/\/))(.*)\#[ 0-9a-z]{3,10} ( http\:\/\/psto.net\/[0-9a-z]{3,10})

В питоне потребовался параметр re.DOTALL, указывающий точке отлавливать все символы, включая перевод строки.
Замечания и предложения по оптимизации приветствуются.

dev, re, psto
Recommended by: @utros
1. 238328 10.08.2011 18:41

работает?

2. 238328 10.08.2011 18:42

и почему a-z? непонятно

3. eoranged238328 /1 10.08.2011 18:43 Pidgin

Да.
http://pastebin.com/H0TwjZFi
Пастбин принял это за спам, лол.

4. eoranged238328 /2 10.08.2011 18:43 Pidgin

А чо не нравится?

5. 238328eoranged /4 10.08.2011 18:48 >>>

ну ок

6. eoranged 10.08.2011 18:51 Pidgin

Бакс на конце проебал >_<

7. 238328 10.08.2011 18:53

Может [ 0-9a-z]{3,10} тоже сделать группой, чтобы урл не дёргать?

8. eoranged238328 /7 10.08.2011 18:53 Pidgin

Ну если надо, то делай. Мне только урл нужен.

9. 238328 10.08.2011 18:56

Алсо можно заменить a-z на othfisehnz

10. 238328238328 /9 10.08.2011 18:57

othfisegnz

11. eoranged238328 /9 10.08.2011 18:57 Pidgin

Я, возможно, нумерацию постов переделаю, так что лучше пусть будет так.

12. 238328eoranged /11 10.08.2011 18:57 >>>

на что переделаешь?

13. eoranged238328 /12 10.08.2011 18:59 Pidgin

Пока не знаю. Когда соберусь, тогда и решу. Но возможно, оно станет попиздаче генерироваться. А номера псто, скорее всего будут типа [a-z]{2,8}

Do you really want to delete ?