0xd34df00d
11.03.2013 19:51 Aedalus
Поиск по сотне метров за сотню-другую микросекунд, включая нормализацию, бустинг, всякие статанализы, спеллчек и прочую хуйню.
Респект. Кстати, а матчасть ты по какой литературе читаешь? По книгам каким и/или умный начальник рассказывает?
Neither. Спеллчек делали с ним на пару из common knowledge, собственно сам индекс вообще я сам почти делал, начальник больше по обвязкам и работе с внешним миром там. // поэтому код индекса весь в лямбдах и говне :3
Так, чтобы прям литература какая-то — неа, не читал никаких особых таких увесистых трудов специально.
а чо за бустинг?
(только не говори "обычный" :)
Самый что ни на есть обычный :]
Нграмма должна буститься по сравнению с обычным словом. Слово из заголовка стоит дороже, чем слово из текста. И так далее.
Зургл?
Сперва два раза прочитал, как Нургл :)
Алсо, поиск, как обычно, Н-граммами?
Нграммами, конечно же, но самый интерес — как эти нграммы порождаются :3
Ну, это понятно. Там-то и начинается большая наука :)
У тебя, кстати, N чему равно? Как у гугла, трём?
Трем // не знал, что как у гугла.
До трех весьма заметно растет качество поиска, а после уже увеличение размера индекса, потребляемая память, тормоза и все такое уже не окупают все медленнее повышающееся качество.
Олсо, похоже, от размера корпуса вся наша херня не зависит, куда важнее длина входа, хотя документы по документам мы ищем вполне без проблем.
http://swtch.com/~rsc/regexp/regexp4.htm...
Вот такое вот. Чувак из гугла описал то, о чём ты говоришь :)
надеюсь не надо говорить, что УИ говно: например я вижу лупу справа как просто картинку, а не кнопку(кнопка же?), цифры списка почему-то отцентрированые по вертикали
инб4 баян
алсо браззерас
инб4 баян
>за сотню-другую микросекунд
можно накинуть еще 50-100 МИЛЛИСЕКУНД, прикрутив свистелки-перделки, пжакс, живое ощущение, и при этом НИКТО не заметит //
> пжакс
Надо внедрить.
я бы внедрил себе в анус
Похуй на UI, тупица, не в этом суть.
Ты феерически тупой просто.
я знаю, что в /0 ты написал про другое и на уи пофиг
пруф или ты тупой(сразу therefore я не тупой) и не понял
Пруф // речь не про уи и взаимодействие, а ядро, а сотня микросекунд позволит обслуживать 10⁴ запросов в секунду тупо на одном ядре на одной машине.
и по-твоему об этом сразу мне было непонятно? Ты тупой чтоле(лайк если программист и понял вопрос)? Короче нелогично думаешь, срсли //срсли