У нас хорошая новость — наконец-то организуем хакатон по данным криминальной статистики, уже в следующие выходные: 22-23 октября.
Читать полностью »
У нас хорошая новость — наконец-то организуем хакатон по данным криминальной статистики, уже в следующие выходные: 22-23 октября.
Читать полностью »
Представляем наш ежемесячный отчёт о результативности «Моего круга». В сентябре у нас было размещено более 650 вакансий, на каждую за месяц в среднем откликнулось 11-12 специалистов. Радуемся нашему очередному рекорду по откликам: в истекшем месяце у нас наблюдается рекордное количество откликов во всех основных сферах деятельности!
А теперь более подробно об откликах на вакансии в самых популярных сферах деятельности.
По данным Data Insight и PayPal, объем розничного экспорта товаров и услуг онлайн из России в 2016 году составил $2 млрд. Ключевыми рынками для ритейлеров являются Северная Америка и Западная Европа. Средний чек — 1000 рублей для контента и 5000 рублей для материальных товаров.
Сегодня поговорим об установлении причинных связей между явлениями, когда невозможно провести эксперимент и А/В-тесты.
Это довольно простая статья, которая будет полезна начинающим в статистике и машинном обучении или тем, кто раньше над такими вопросами не задумывался.
Действительно ли пациентам, тестирующим новое лекарство, становится лучше из-за лекарства, или они все все равно бы выздоровели? Ваши продавцы действительно эффективны или же они говорят с теми клиентами, которые и так готовы совершить покупку? Действительно ли Сойлент (или рекламная кампания, которая обойдётся фирме в миллион долларов) стоит вашего времени?
В 1997 году, когда в штате Массачусетс исследователям в медицинской области начали предоставлять доступ к медицинским картам чиновников, правительство удаляло из списков имена пациентов, их адреса и номера карт соцстрахования. Уильям Уэлд, бывший тогда губернатором, уверил общественность, что восстановить личность по записи будет невозможно.
Уже через несколько дней в офис Уэлда пришло письмо, отправленное студентом из Массачусетского технологического института. В конверт были вложены выписки из медицинской карты губернатора.
Хотя очевидные идентификаторы были удалены, чиновники решили оставить дату рождения, пол и почтовый индекс (ZIP-код). Проведя перекрёстное сравнение этих данных с записями регистрации голосов, Латанья Суини [Latanya Sweeney] смог вычислить медкарту Уэлда.
Работа Суини и другие прорывы в приватности, случившиеся за последние 15 лет, поднимают вопросы безопасности якобы анонимных данных.
Читать полностью »
Статистика приходит к нам на помощь при решении многих задач, например: когда нет возможности построить детерминированную модель, когда слишком много факторов или когда нам необходимо оценить правдоподобие построенной модели с учётом имеющихся данных. Отношение к статистике неоднозначное. Есть мнение, что существует три вида лжи: ложь, наглая ложь и статистика. С другой стороны, многие «пользователи» статистики слишком ей верят, не понимая до конца, как она работает: применяя, например, тест Стьюдента к любым данным без проверки их нормальности. Такая небрежность способна порождать серьёзные ошибки и превращать «поклонников» теста Стьюдента в ненавистников статистики. Попробуем поставить токи над i и разобраться, какие модели случайных величин должны использоваться для описания тех или иных явлений и какая между ними существует генетическая связь.
Читать полностью »
В одном из предыдущих постов мы обсудили, пожалуй, центральное понятие в анализе данных и проверке гипотез — p — уровень значимости. Если мы не применяем байесовский подход, то именно значение p — value мы используем для принятия решения о том, достаточно ли у нас оснований отклонить нулевую гипотезу нашего исследования, т.е. гордо заявить миру, что у нас были получены статистически значимые различия.
Однако в большинстве статистических тестов, используемых для проверки гипотез, (например, t — тест, регрессионный анализ, дисперсионный анализ) рядом с p — value всегда соседствует такой показатель как число степеней свободы, он же degrees of freedom или просто сокращенно df, о нем мы сегодня и поговорим.
Компания Opera провела опрос 10 тысяч пользователей своего приложения для ОС Android по поводу использования VPN. 70% пользователей сети беспокоятся о своей безопасности и защите персональных данных. Больше всего эта проблема занимает пользователей Великобритании (где эта проблема вызывает озабоченность у 80%) и США (85% опрошенных).
По итогам 2015 года объем экономики Рунета составил 1 355,38 млрд рублей или 2,4% ВВП России. Ожидается, что в 2016 он вырастет до 1581,34 млрд рублей, следуют из исследования РАЭК «Экономика Рунета 2015−2016» (документ).
Более 70% россиян пользуется интернетом, но 49% из них никогда не совершали покупок в интернет-магазинах, а регулярным онлайн-шоппингом занимается только 8%. Об этом сообщают «Известия» со ссылкой на данные исследования «Левада-центра».
За последний год число российских интернет-пользователей, которые заходят в сеть через компьютер, Читать полностью »