Рубрика «статистика» - 50

Хакатон по данным криминальной статистики - 1

У нас хорошая новость — наконец-то организуем хакатон по данным криминальной статистики, уже в следующие выходные: 22-23 октября.
Читать полностью »

Представляем наш ежемесячный отчёт о результативности «Моего круга». В сентябре у нас было размещено более 650 вакансий, на каждую за месяц в среднем откликнулось 11-12 специалистов. Радуемся нашему очередному рекорду по откликам: в истекшем месяце у нас наблюдается рекордное количество откликов во всех основных сферах деятельности!

А теперь более подробно об откликах на вакансии в самых популярных сферах деятельности.

Отчет о результатах «Моего круга» за сентябрь 2016, и самые популярные вакансии месяца - 1
Читать полностью »

По данным Data Insight и PayPal, объем розничного экспорта товаров и услуг онлайн из России в 2016 году составил $2 млрд. Ключевыми рынками для ритейлеров являются Северная Америка и Западная Европа. Средний чек — 1000 рублей для контента и 5000 рублей для материальных товаров.

Читать полностью »

Как проверить причинную связь без эксперимента? - 1

Сегодня поговорим об установлении причинных связей между явлениями, когда невозможно провести эксперимент и А/В-тесты.
Это довольно простая статья, которая будет полезна начинающим в статистике и машинном обучении или тем, кто раньше над такими вопросами не задумывался.

Действительно ли пациентам, тестирующим новое лекарство, становится лучше из-за лекарства, или они все все равно бы выздоровели? Ваши продавцы действительно эффективны или же они говорят с теми клиентами, которые и так готовы совершить покупку? Действительно ли Сойлент (или рекламная кампания, которая обойдётся фирме в миллион долларов) стоит вашего времени?

Читать полностью »

В 1997 году, когда в штате Массачусетс исследователям в медицинской области начали предоставлять доступ к медицинским картам чиновников, правительство удаляло из списков имена пациентов, их адреса и номера карт соцстрахования. Уильям Уэлд, бывший тогда губернатором, уверил общественность, что восстановить личность по записи будет невозможно.

Уже через несколько дней в офис Уэлда пришло письмо, отправленное студентом из Массачусетского технологического института. В конверт были вложены выписки из медицинской карты губернатора.

Хотя очевидные идентификаторы были удалены, чиновники решили оставить дату рождения, пол и почтовый индекс (ZIP-код). Проведя перекрёстное сравнение этих данных с записями регистрации голосов, Латанья Суини [Latanya Sweeney] смог вычислить медкарту Уэлда.

Работа Суини и другие прорывы в приватности, случившиеся за последние 15 лет, поднимают вопросы безопасности якобы анонимных данных.
Читать полностью »

в 7:46, , рубрики: f-критерий, f-распределение, f-тест, t-критерий, t-распределение, t-тест, z-критерий Фишера, z-распределение, z-тест, Алгоритмы, Анализ и проектирование систем, бета распределение, биноминальное распределение, гамма распределение, геометрическое рапределение, гипергеометрическое распределение, двойное показательное, двойное экспоненциальное, Занимательные задачки, критерий Пирсона, критерий согласия, критерий хи квадрат, математика, моделирование, нормальное распределение, отрицательное биноминальное, плотность вероятности, показательное распределение, профит фактор, распределение Бернулли, распределение Вейбулла, распределение Гаусса, распределение Коши, распределение Лапласса, распределение Паскаля, распределение Пирсона, распределение пуассона, распределение Стьюдента, распределение Фишера, распределение хи квадрат, распределение Эрланга, случайная величина, статистика, статистический тест, статитический анализ, теория вероятностей, тест Стьюдента, тест Фишера, экспоненциальное распределение

«Правда, чистая правда и статистика» или «15 распределений вероятности на все случаи жизни» - 1 Статистика приходит к нам на помощь при решении многих задач, например: когда нет возможности построить детерминированную модель, когда слишком много факторов или когда нам необходимо оценить правдоподобие построенной модели с учётом имеющихся данных. Отношение к статистике неоднозначное. Есть мнение, что существует три вида лжи: ложь, наглая ложь и статистика. С другой стороны, многие «пользователи» статистики слишком ей верят, не понимая до конца, как она работает: применяя, например, тест Стьюдента к любым данным без проверки их нормальности. Такая небрежность способна порождать серьёзные ошибки и превращать «поклонников» теста Стьюдента в ненавистников статистики. Попробуем поставить токи над i и разобраться, какие модели случайных величин должны использоваться для описания тех или иных явлений и какая между ними существует генетическая связь.
Читать полностью »

В одном из предыдущих постов мы обсудили, пожалуй, центральное понятие в анализе данных и проверке гипотез — p — уровень значимости. Если мы не применяем байесовский подход, то именно значение p — value мы используем для принятия решения о том, достаточно ли у нас оснований отклонить нулевую гипотезу нашего исследования, т.е. гордо заявить миру, что у нас были получены статистически значимые различия.

Однако в большинстве статистических тестов, используемых для проверки гипотез, (например, t — тест, регрессионный анализ, дисперсионный анализ) рядом с p — value всегда соседствует такой показатель как число степеней свободы, он же degrees of freedom или просто сокращенно df, о нем мы сегодня и поговорим.

О степенях свободы в статистике - 1
Читать полностью »

Компания Opera провела опрос 10 тысяч пользователей своего приложения для ОС Android по поводу использования VPN. 70% пользователей сети беспокоятся о своей безопасности и защите персональных данных. Больше всего эта проблема занимает пользователей Великобритании (где эта проблема вызывает озабоченность у 80%) и США (85% опрошенных).

Читать полностью »

По итогам 2015 года объем экономики Рунета составил 1 355,38 млрд рублей или 2,4% ВВП России. Ожидается, что в 2016 он вырастет до 1581,34 млрд рублей, следуют из исследования РАЭК «Экономика Рунета 2015−2016» (документ).

  • Объем онлайн-ритейла составил 315,3 млрд рублей, что на 13% больше, чем в 2014 году, Читать полностью »

Более 70% россиян пользуется интернетом, но 49% из них никогда не совершали покупок в интернет-магазинах, а регулярным онлайн-шоппингом занимается только 8%. Об этом сообщают «Известия» со ссылкой на данные исследования «Левада-центра».

За последний год число российских интернет-пользователей, которые заходят в сеть через компьютер, Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js