0xd34df00d 11.03.2013 19:51 Aedalus


Поиск по сотне метров за сотню-другую микросекунд, включая нормализацию, бустинг, всякие статанализы, спеллчек и прочую хуйню.

1. kb 11.03.2013 20:34

Респект. Кстати, а матчасть ты по какой литературе читаешь? По книгам каким и/или умный начальник рассказывает?

2. 0xd34df00dkb /1 11.03.2013 20:38 Aedalus

Neither. Спеллчек делали с ним на пару из common knowledge, собственно сам индекс вообще я сам почти делал, начальник больше по обвязкам и работе с внешним миром там. // поэтому код индекса весь в лямбдах и говне :3

Так, чтобы прям литература какая-то — неа, не читал никаких особых таких увесистых трудов специально.

3. kb0xd34df00d /2 11.03.2013 20:40 1859803192136332411751626

а чо за бустинг?

4. kbkb /3 11.03.2013 20:40 1859803192136332411751626

(только не говори "обычный" :)

5. 0xd34df00dkb /4 11.03.2013 20:43 Aedalus

Самый что ни на есть обычный :]
Нграмма должна буститься по сравнению с обычным словом. Слово из заголовка стоит дороже, чем слово из текста. И так далее.

6. Rayslava 12.03.2013 04:10

Зургл?
Сперва два раза прочитал, как Нургл :)
Алсо, поиск, как обычно, Н-граммами?

7. 0xd34df00dRayslava /6 12.03.2013 05:12 Aedalus

Нграммами, конечно же, но самый интерес — как эти нграммы порождаются :3

8. Rayslava0xd34df00d /7 12.03.2013 05:13 3678737551136360862392363

Ну, это понятно. Там-то и начинается большая наука :)
У тебя, кстати, N чему равно? Как у гугла, трём?

9. 0xd34df00dRayslava /8 12.03.2013 05:14 Aedalus

Трем // не знал, что как у гугла.
До трех весьма заметно растет качество поиска, а после уже увеличение размера индекса, потребляемая память, тормоза и все такое уже не окупают все медленнее повышающееся качество.

Олсо, похоже, от размера корпуса вся наша херня не зависит, куда важнее длина входа, хотя документы по документам мы ищем вполне без проблем.

10. Rayslava0xd34df00d /9 12.03.2013 05:16 3678737551136360862392363

http://swtch.com/~rsc/regexp/regexp4.htm...
Вот такое вот. Чувак из гугла описал то, о чём ты говоришь :)

11. 238328 12.03.2013 11:15

надеюсь не надо говорить, что УИ говно: например я вижу лупу справа как просто картинку, а не кнопку(кнопка же?), цифры списка почему-то отцентрированые по вертикали
инб4 баян
алсо браззерас
инб4 баян

12. 238328 12.03.2013 11:18

>за сотню-другую микросекунд
можно накинуть еще 50-100 МИЛЛИСЕКУНД, прикрутив свистелки-перделки, пжакс, живое ощущение, и при этом НИКТО не заметит //

13. Rayslava238328 /12 12.03.2013 11:18 3678737551136360862392363

> пжакс
Надо внедрить.

14. 238328Rayslava /13 12.03.2013 11:20

я бы внедрил себе в анус

15. 0xd34df00d238328 /11 12.03.2013 11:21 Azoth_primary

Похуй на UI, тупица, не в этом суть.

16. 0xd34df00d238328 /12 12.03.2013 11:21 Azoth_primary

Ты феерически тупой просто.

17. 2383280xd34df00d /15 12.03.2013 11:24

я знаю, что в /0 ты написал про другое и на уи пофиг

18. 2383280xd34df00d /16 12.03.2013 11:25

пруф или ты тупой(сразу therefore я не тупой) и не понял

19. 0xd34df00d238328 /18 12.03.2013 11:28 Azoth_primary

Пруф // речь не про уи и взаимодействие, а ядро, а сотня микросекунд позволит обслуживать 10⁴ запросов в секунду тупо на одном ядре на одной машине.

20. 2383280xd34df00d /19 12.03.2013 11:29

и по-твоему об этом сразу мне было непонятно? Ты тупой чтоле(лайк если программист и понял вопрос)? Короче нелогично думаешь, срсли //срсли

Do you really want to delete ?