В предыдущих статьях, посвященных вероятностному описанию конверсии сайта, мы рассматривали число событий (просмотров и кликов), как выборку случайной величины, без зависимости от времени. Теперь пришло время сделать следующий шаг и ввести ее в рассмотрение.
Читать полностью »
Рубрика «теория вероятностей» - 5
Машинное обучение — 3. Пуассоновский случайный процесс: просмотры и клики
2015-03-25 в 7:59, admin, рубрики: Блог компании Нерепетитор.ру, Занимательные задачки, конверсия сайтов, математика, машинное обучение, Пуассон, случайные величины, случайный процесс, теория вероятностей, метки: пуассонЗанимательная теория вероятностей или сколько нужно двигателей?
2015-03-16 в 3:02, admin, рубрики: комбинаторика, космонавтика, Научно-популярное, теория вероятностей, теория надежности
В обсуждении проекта «большого глупого носителя» OTRAG, состоящего из пакета простых ракет, неоднократно поднимался вопрос надёжности такого количества двигателей. Вспоминалась печальная история советской сверхтяжёлой ракеты Н-1, у которой на первой ступени стояло 30 двигателей, и которая ни разу за четыре полёта не долетела до конца её работы. В комментарии рассказать про теорию вероятностей и расчёт надёжности места нет, поэтому предлагаю вашему вниманию занимательный рассказ о количестве двигателей, надёжности, комбинаторике и теории вероятностей.
Читать полностью »
Дискретные структуры: матан для айтишников
2015-03-03 в 15:33, admin, рубрики: Алгоритмы, дискретная математика, дискретный анализ, математика, теория вероятностей, теория графов
Посмотришь на любую программу обучения по IT-специальности, и тут же увидишь дисциплину «Дискретная математика» (возможно, под другим названием), обычно для перво- или второкурсников. И её наличие вполне разумно, поскольку дискретная математика и непрерывная математика (представленная на первом курсе институтов с незапамятных времён математическим анализом) — две грани единой Математики, — красивой, могучей науки.
Хотя раньше такого понятия, как «дискретная математика» вовсе не было, это не значит, что не возникало дискретных задач: Абель, Дирихле, Фибоначчи, Эйлер, чьи имена возникают по ходу изучения дискретной математики, — отнюдь не наши современники! Но просто в те времена для выделения самостоятельной ветви математики ещё не сложилось критической массы задач и приёмов, не было видно взаимосвязей между ними. А большое количество плодотворных взаимосвязей между, на первый взгляд, различными понятиями, — то, что математики в своей науке очень ценят.
Ну хорошо, математикам всё математическое интересно. А зачем дискретная математика программисту?
Читать полностью »
Это правильно, но неверно
2014-12-29 в 3:58, admin, рубрики: бесконечности не бывает, гармонический ряд, для плоскости семь, инфляция, комбинаторика, математика, неполный перебор, онлайнер живи, плохое собеседование, постоянная Эйлера, пятьдесят на пятьдесят, рубль держись, ряды всюду, с наступающим, скидки, скоро весна, суммирование рядов, теория вероятностей, тэги не читают, Учебный процесс в IT, центр тяжести, четыре мало Специалисты заслуженно не любят задачи и головоломки на собеседованиях. Но мы просто любим порешать такие задачи в свое удовольствие. Вот что мне лично не нравиться, так это когда ты получаешь правильный ответ, но при этом твое решение кажется автору неверным. Хочу просто показать решение нескольких популярных подобных задач, которые можно получить в уме и без сложных расчетов и сопоставить их с авторскими верными.
Читать полностью »
Закон Бенфорда и распределения под него попадающие
2014-10-19 в 15:06, admin, рубрики: big data, бесконечная дисперсия, борьба с фальсификациями, закон Бенфорда, математика, математическая статистика, Научно-популярное, правило первой цифры, скоро зима, списки стран, теория вероятностей, устойчивое распределениеВ теории вероятностей и статистике правило первой цифры, или закон Бенфорда, показывает любопытное проявления частот первой цифры данных из реальной жизни. Для школьников и домохозяек этот закон можно вольно сформулировать так: есть наборы данных, у которых первая цифра будет единицей примерно в 6 раз чаще, чем девятка и это соотношение не изменится при масштабировании исходного набора. Более строго можно сформулировать так: набор чисел удовлетворяет закону Бенфорда, если первая цифра d появляется с вероятностью
Здесь N – основание системы счисления, должно быть больше 2, далее будем рассматривать 10.
Для строгих математиков это правило формулируется так: существуют такие случайные величины, для которых распределение вероятностей дробной части логарифма по любому основанию большему 1 сходится к равномерному на отрезке [0; 1] распределению. Далее я постараюсь писать как можно популярнее и подробнее, укажу примеры, ограничения, применение и случайные величины, для которых закон применим.
Читать полностью »
Анализируем странные корреляции
2014-09-11 в 10:57, admin, рубрики: интуиция, математика, Статистика в IT, теория вероятностей
Недавно заметил в ленте фейсбука ссылку на статью с кучей примеров «странных корреляций» как на картинке. Первоисточник оказывается здесь, и там таких примеров штук 20. Решил по-практиковаться в статистике и проверить насколько эти корреляции удивительны на самом деле.
Заинтересованных прошу под кат.
Читать полностью »
Вероятность намешать уникальную колоду карт. Неожиданный результат
2014-08-12 в 7:19, admin, рубрики: колода карт, математика, мешаем-мешаем, покер, теория вероятностей Все из нас когда-либо играли в карты. И любой держал в руках, мешал карточную колоду. Вот и я, как-то сидя и перемешивая стандартную колоду из 52 карт, задумался, а какова вероятность того, что результат будет уникальным? Что никто и никогда после перемешивания не получал карты в колоде в том порядке, что и я?
Казалось бы, первое, что приходит в голову — вероятность мала. Ведь люди постоянно играют в карты. А если учесть то, что люди непрерывно играют в покер в интернете, так вообще, наверное, все варианты давно перепробованы… Или нет?
О формуле Байеса, прогнозах и доверительных интервалах
2014-08-10 в 0:13, admin, рубрики: Алгоритмы, Байес, байесовский подход, математика, теория вероятностей, теория вероятности, терверНа Хабре много статей по этой теме, но они не рассматривают практических задач. Я попытаюсь исправить это досадное недоразумение. Формула Байеса применяется для фильтрации спама, в рекомендательных сервисах и в рейтингах. Без нее значительное число алгоритмов нечеткого поиска было бы невозможно. Кроме того, это формула явилась причиной холивара среди математиков.
Вероятностные модели: LDA, часть 2
2014-07-16 в 15:52, admin, рубрики: data mining, байесовские сети, Блог компании Surfingbird, искусственный интеллект, классификация, кластеризация, математика, математическое моделирование, теория вероятностей Продолжаем разговор. В прошлый раз мы сделали первый шаг на переходе от наивного байесовского классификатора к LDA: убрали из наивного байеса необходимость в разметке тренировочного набора, сделав из него модель кластеризации, которую можно обучать ЕМ-алгоритмом. Сегодня у меня уже не осталось отговорок – придётся рассказывать про саму модель LDA и показывать, как она работает. Когда-то мы уже говорили об LDA в этом блоге, но тогда рассказ был совсем короткий и без весьма существенных подробностей. Надеюсь, что в этот раз удастся рассказать больше и понятнее.
Читать полностью »