eoranged
10.08.2011 18:40 Pidgin
В общем, вот регулярка, которой можно парсить посты, приходящие через бота:
^@([\w\-]{2,})\s?(?:→\s?@([\w\-]{2,}))?\:\n(?:\*([^\n]+)(?:\n|\/\/))(.*)\#[ 0-9a-z]{3,10} ( http\:\/\/psto.net\/[0-9a-z]{3,10})
В питоне потребовался параметр re.DOTALL, указывающий точке отлавливать все символы, включая перевод строки.
Замечания и предложения по оптимизации приветствуются.
Recommended by:
@utros
работает?
и почему a-z? непонятно
Да.
http://pastebin.com/H0TwjZFi
Пастбин принял это за спам, лол.
А чо не нравится?
ну ок
Бакс на конце проебал >_<
Может [ 0-9a-z]{3,10} тоже сделать группой, чтобы урл не дёргать?
Ну если надо, то делай. Мне только урл нужен.
Алсо можно заменить a-z на othfisehnz
othfisegnz
Я, возможно, нумерацию постов переделаю, так что лучше пусть будет так.
на что переделаешь?
Пока не знаю. Когда соберусь, тогда и решу. Но возможно, оно станет попиздаче генерироваться. А номера псто, скорее всего будут типа [a-z]{2,8}