@dk
dk
13 Feb 2014

Что-то в последнее время стало модно ругать p-values: http://www.nature.com/news/...tical-errors-1.14700

#gde 4
Вы можете выбрать до 10 файлов общим размером не более 10 МБ.
13 Feb 2014

dk, что вообще по статам можно почитать, чтобы нубу с физтеховским образованием их всё же как-то осилить и получить уверенность? А то я почему-то всю жизнь их подсознательно избегал и боялся.

#gde/1
Вы можете выбрать до 10 файлов общим размером не более 10 МБ.
13 Feb 2014

0xd34df00d, вообще я осваивал статы (из-за того, что увлекся machine learning) практически с нуля, поэтому ты с физтеховским образованием должен вообще влет их освоить.

Мне помогли:
a) Статистика
- https://www.udacity.com/course/st101
- Probability and Statistics (4th Edition) by Morris H. DeGroot
- Statistics in a nutshell

b) Теорвер
- Thinkbayes
- Introduction to probability models (M. Ross)

  • разные практические задачки из CS, которые можно решить статистически. Например можно написать тест на честность (uniformity) генератора случайных чисел (это кстати есть во 2м томе Кнута), можно статистически протестировать разные hash functions и выбрать наиболее приемлемую, можно посмотреть на то, как работает histogram normalisation в image processing (хорошо помогает понять принципы работы CDF), можно эмулировать частоту запросов клиентов по какому-нибудь распределению (в данном случае наверное по Poisson)

P/S: говорят еще, что курс Probabilistic Graphical Models на курсере очень нечего, но я его не смотрел.

#gde/2 в ответ на /1
Вы можете выбрать до 10 файлов общим размером не более 10 МБ.
13 Feb 2014

dk, о, спасибо.

Я тоже machine learning'ом увлекаюсь, и моего статообразования более-менее хватает, но всё равно хотелось бы как-то что-то поботать. И статтесты я писал, когда это действительно надо было (проверить гипотезу о нормальности распределения коэффициентов регрессионной модели при шуме во входных данных), и они даже работали, но всё равно какое-то ощущение отсутствия системности знаний есть.

В общем, да, круто, спасибо за ссылки, особенно книжечки.

#gde/3 в ответ на /2
Вы можете выбрать до 10 файлов общим размером не более 10 МБ.
13 Feb 2014

на тему machine learning глянь на https://www.kaggle.com/competitions Там очень неплохие практические задачи

#gde/4 в ответ на /3
Вы можете выбрать до 10 файлов общим размером не более 10 МБ.

Добавить пост

Вы можете выбрать до 10 файлов общим размером не более 10 МБ.
Для форматирования текста используется Markdown.