Метка «теория вероятностей» - 2

Вероятностные модели: байесовские сети

2013-04-12 в 12:31, admin, рубрики: data mining, байесовские сети, Блог компании Surfingbird, искусственный интеллект, математика, математическое моделирование, теория вероятностей, метки: data mining, байесовские сети, математика, математическое моделирование, теория вероятностей

В этом блоге мы уже много о чём поговорили: были краткие описания основных рекомендательных алгоритмов (постановка задачи, user-based и item-based, SVD: 1, 2, 3, 4), о нескольких моделях для работы с контентом (наивный Байес, LDA, обзор методов анализа текстов), был цикл статей о холодном старте (постановка задачи, текстмайнинг, теги), была мини-серия о многоруких бандитах (часть 1, часть 2).

Чтобы двигаться дальше и поместить эти и многие другие методы в общий контекст, нам нужно выработать некую общую базу, научиться языку, на котором разговаривают современные методы обработки данных, – языку графических вероятностных моделей. Сегодня – первая часть этого рассказа, самая простая, с картинками и пояснениями.

Вероятностные модели: байесовские сети
Читать полностью »

Ломаем спички, или Алиса в стране математических ошибок

2013-01-25 в 9:10, admin, рубрики: кэрролл, математика, ошибка перевода, теория вероятностей, метки: кэрролл, математика, ошибка перевода, теория вероятностей

Есть у меня любимый форум, посвящённый головоломкам. Недавно я наткнулся там на следующую задачу:

Сидел однажды Вася у себя на кухне и от нечего делать спички ломал. Поломал, поломал и задумался — чему равна вероятность того, что по крайней мере одна спичка будет переломана точно посередине? Запас спичек у Васи неограничен.

Я довольно быстро доказал, что вероятность этого события равна нулю. Гордый собой, я запостил решение и ответ, ожидая плюсика в карму. Оказалось, однако, что авторский ответ совсем другой: 1 — 1/e. Забегая вперёд, скажу, что этот ответ неверен.

Неправильные авторские решения — довольно частое явление в интернет-головоломках. И я ни за что не стал бы писать этот пост, если бы автором задачи, а также её неверного решения, не был британский логик и алгебраист Чарльз Л. Доджсон, более известный под псевдонимом Льюис Кэрролл.
Читать полностью »

Любимое число %username%

2012-11-02 в 7:47, admin, рубрики: математика, случайные величины, сознание, Статистика в IT, теория вероятностей, метки: случайные величины, сознание, теория вероятностей

Любимое число %username%

Привет Хабражитель! Предлагаю принять участие в микроэксперименте.
Читать полностью »

О создании персональных рейтингов. Вроде IMHO.net

2012-09-06 в 14:59, admin, рубрики: Алгоритмы, Веб-разработка, математика, рейтинг, рейтинги, рейтинги в виде звезд, сортировка, сортировки, сортировщик страниц, статистика, статистический анализ, теория вероятностей, теория вероятности, тервер, метки: математика, рейтинг, рейтинги, рейтинги в виде звезд, сортировка, сортировки, сортировщик страниц, статистика, статистический анализ, теория вероятностей, теория вероятности, тервер

В прошлых статьях я затрагивал тему простых рейтингов. В комментариях меня попросили расписать тему рейтингов, которые выдают для каждого пользователя свои.
Читать полностью »

О сортировке контента на основе оценок пользователей: Часть 3

2012-09-05 в 13:09, admin, рубрики: Алгоритмы, Веб-разработка, математика, рейтинг, рейтинги, рейтинги в виде звезд, сортировка, сортировки, сортировщик страниц, статистика, статистический анализ, теория вероятностей, теория вероятности, тервер, метки: математика, рейтинг, рейтинги, рейтинги в виде звезд, сортировка, сортировки, сортировщик страниц, статистика, статистический анализ, теория вероятностей, теория вероятности, тервер

В прошлой статье я вывел формулу, которая прогнозирует рейтинг на основе оценок статьи и средней оценки по сайту. Думал в этой статье, я покажу качество ее прогноза, улучшу прогноз за счет дисперсии. Однако, появилась еще одна проблема.

Читать полностью »

О сортировке контента на основе оценок пользователей: Часть 2

2012-09-03 в 20:57, admin, рубрики: Алгоритмы, Веб-разработка, математика, рейтинг, рейтинги, рейтинги в виде звезд, сортировка, сортировки, сортировщик страниц, статистика, статистический анализ, теория вероятностей, теория вероятности, тервер, метки: математика, рейтинг, рейтинги, рейтинги в виде звезд, сортировка, сортировки, сортировщик страниц, статистика, статистический анализ, теория вероятностей, теория вероятности, тервер

Прошлая статья привлекла большой интерес. И даже, на некоторое время, стала лучшей за 24 часа. У меня появилось несколько идей и на часть вопросов в комментариях нужно ответить более развернуто.

Читать полностью »

О сортировке контента на основе оценок пользователей

2012-09-01 в 22:23, admin, рубрики: Алгоритмы, Веб-разработка, математика, рейтинг, рейтинги, сортировка, сортировки, сортировщик страниц, теория вероятностей, теория вероятности, тервер, метки: математика, рейтинг, рейтинги, сортировка, сортировки, сортировщик страниц, теория вероятностей, теория вероятности, тервер

Написать этот пост меня привлекла эта статья. Многие ее помнят по вот этой картинке.

Статья затрагивает правильную тему, однако с точки зрения математики и здравого смысла она в корне не верна.
Читать полностью »

Рандомизированые Алгоритмы

2012-04-18 в 9:53, admin, рубрики: Алгоритмы, обзор, рандомизация, теория вероятностей, метки: обзор, рандомизация, теория вероятностей

Надеюсь что тема будет интересна людям которые знакомы с обычными алгоритмами и хотят узнать об упомянутых выше в общих чертах, что бы иметь представление о чем речь. Постараюсь избегать вычеслений и излагать на интуитивном уровне. И хотя интуиция в теории вероятностей часто подводит, давайте все же попробуем.
Читать полностью »

Информация

Комментарии

Рекомендуем

Метка «теория вероятностей» - 2

Вероятностные модели: байесовские сети

Ломаем спички, или Алиса в стране математических ошибок

Любимое число %username%

О создании персональных рейтингов. Вроде IMHO.net

О сортировке контента на основе оценок пользователей: Часть 3

О сортировке контента на основе оценок пользователей: Часть 2

О сортировке контента на основе оценок пользователей

Рандомизированые Алгоритмы