0xd34df00d 31.10.2011 14:42 Azoth_primary

Оказывается, сгенерить набор рандомных текстов для теста системы поиска по документам — не такая тривиальная задача, как кажется на первый взгляд.

1. Elena 31.10.2011 14:42 302359133132065706330157

а зачем их генерить?

2. 0xd34df00dElena /1 31.10.2011 14:43 Azoth_primary

Для теста системы поиска по документам, очевидно.

3. Elena0xd34df00d /2 31.10.2011 14:44 302359133132065706330157

я имею ввиду, почему нельзя использовать готовые — книги например с lib.ru?

4. 0xd34df00dElena /3 31.10.2011 14:44 Azoth_primary

Ты готова мне накачать 10 гигов книг и обработать их в няшный .txt?

5. Elena0xd34df00d /4 31.10.2011 14:45 302359133132065706330157

ты какой то ад придумываешь :(

6. 0xd34df00dElena /5 31.10.2011 14:45 Azoth_primary

R

7. kb 31.10.2011 14:48 c8541125

просто-таки срыв покровов :-)

8. Kerrigan 31.10.2011 14:53 tktower

возьми готовый языковой корпус

9. 0xd34df00dKerrigan /8 31.10.2011 14:55 Azoth_primary

Откуда?

10. Kerrigan0xd34df00d /9 31.10.2011 14:57 tktower

http://studiorum.ruscorpora.ru/index.php... тут что-то есть

11. 17eyesKerrigan /10 31.10.2011 14:57 Azoth

О, блин, обогнал. :))

12. 0xd34df00dKerrigan /8 31.10.2011 15:03 Azoth_primary

А че, там не слова что ли? Не нужно.

13. ulidtko 31.10.2011 19:36

гугли натуральные лингвокорпуса без гмо, что ты как последний теоретик.

14. 0xd34df00dulidtko /13 31.10.2011 19:37 Azoth_primary

Лень. Лучше написать еще хаскель-кода.

15. ulidtko0xd34df00d /14 31.10.2011 19:38

посмотрите какой фанбой.

16. 0xd34df00dulidtko /15 31.10.2011 19:39 Azoth_primary

R

Do you really want to delete ?