0xd34df00d
31.10.2011 14:42 Azoth_primary
Оказывается, сгенерить набор рандомных текстов для теста системы поиска по документам — не такая тривиальная задача, как кажется на первый взгляд.
Оказывается, сгенерить набор рандомных текстов для теста системы поиска по документам — не такая тривиальная задача, как кажется на первый взгляд.
а зачем их генерить?
Для теста системы поиска по документам, очевидно.
я имею ввиду, почему нельзя использовать готовые — книги например с lib.ru?
Ты готова мне накачать 10 гигов книг и обработать их в няшный .txt?
ты какой то ад придумываешь :(
R
просто-таки срыв покровов :-)
возьми готовый языковой корпус
Откуда?
http://studiorum.ruscorpora.ru/index.php... тут что-то есть
О, блин, обогнал. :))
А че, там не слова что ли? Не нужно.
гугли натуральные лингвокорпуса без гмо, что ты как последний теоретик.
Лень. Лучше написать еще хаскель-кода.
посмотрите какой фанбой.
R