0xd34df00d
→ arts
28.01.2012 12:33 Azoth_primary
Давай упоремся всяким Data Mining'ом в контексте пстача? Например, вот заблеклистил ты человека, а тебе предлагается, кого еще заблеклистить.
Или выявление тематик постов и стохастический блеклист постов же.
Или формирование под-сообществ с, по желанию, всякой разной изоляцией.
А потом можно двигать пстощ в массы, не боясь, что гламурные кисы обоссутся от анусов-псов.
Конечно же, дедфуду иммунитет к BL :3
я только за (но я не арц)
НЕЕЕЕЕТ
Ня.
Почему?
слишком жирно, про иммунитет же.
А вообще идея ок. Особенно направленная в сторону автоматической фильтрации, основанной на предпочтениях.
вы хотите сделать жубо
нет.
Я просто хочу хорошенько обмазаться предиктингом и всем таким.
Жубо до этого как до Китая раком.
и я бы тоже обмазался. Но, боюсь, для этого псто прийдётся оче сильно перепиливать.
Обоснуйте.
Хук на добавление сообщения/коммента/рекомендации, хук на BL и так далее, хранение таймштампов команд типа U/S/BL, и все.
так ты никакую предобработку предпочтений не сможешь сделать
Почему? Если в хуке ты сможешь сделать что-то типа asyncReply ("You may also want to blacklist " + suggestions.join ("; ")), то все ок.
Хорошая идея.
Тут правда вылезет проблема в анализе социального графа при росте количества народу тут.
Ну и гигантские гейлисты — не ок в плане производительности и больше нужны для целей анального огораживания от конкретных субъектов.
А вот рекомендации кого бы почитать по контенту, предпочтениям тех, кто читает тех же, кого читаешь ты, а так же фактору рандома, были бы ок.
смотрите какой ПРОФЕССИОНАЛ высказал своё весомое мнение.
Лол, ок.
какбы ни модели, ни метода, ни дизайна ещё нет — а ты уже предрекаешь проблемы с производительностью. Утрос, nuff said.
«какбы ни модели, ни метода, ни дизайна ещё нет — а ты уже предрекаешь, что твоё решение лучше. Утрос, nuff said.»
fixed
Я про производительность механизма гей-листов на массовых сервисах вообще.
Даже не прочитал коммент, а уже вешаешь ярлыки.
Улитко, nuff said.
!R
> не прочитал коммент
што.
у-образные, лучше вместо того, чтобы сраться, в веснот зарубились бы
Не нужен.
Мне лень, я тут анальной модерастией занимаюсь :3
ну-ка, давай, изложи нам свой увесистый опыт в области производительности массовых сервисов.
*slow*
Сказал чувак, играющий в космическую фигню.
нуэ.
Уже надоело. Снова играю в sauerbraten.
Не вижу проблемы запилить должным образом outer/inner join при селекте, кому доставлять, кстати.
ну вот именно же блджад.
4 сервиса с ~100-150 Гб HTTP-траффика в сутки и десятком миллионов пользователей — это нормальный опыт?
Не видео/аудио-стриминг и не файлообменники.
Десяток миллионов в сутки или ваще?
По объему траффа у меня получается оценка в 1-2 пользователя в секунду, а это охуительно мало.
И в сутки и вообще.
на этом коменте я снова проиграл
Обсчитался. Это за 24 минуты. Соответственно ещё на 60 умножить надо. И даже Это ни разу не 1-2 пользователя в секунду :)
У нас средняя скорость исходящего потока около 60 Мб/с.
М? Аудитория почти постоянная, так что всё нормально.
В течении суток в совокупности хотя бы на один из сервисов приходит около 90% клиентов.
для начала хотя бы синонимы тэгов. например *гей и *linux :D
Классическая задача topic modelling'а.
Еще автоматические статистические ачивки с записью в личное дело. "Форсит геев в комментах". "Постит картиночки". И прочее.
Жубо это сраный детерминированный автомат.
Дыа! Ачивки!