Рубрика «статистика» - 104

Краткий и несложный материал для неспециалистов, рассказывающий в наглядной форме о различных методах поиска регрессионных зависимостей. Это все и близко не академично, зато надеюсь что понятно. Прокатит как мини-методичка по обработке данных для студентов естественнонаучных специальностей, которые математику знают плохо, впрочем как и автор. Расчеты в Матлабе, подготовка данных в Экселе — так уж повелось в нашей местности
Корреляции для начинающих

Введение

Зачем это вообще надо? В науке и около нее очень часто возникает задача предсказания какого-то неизвестного параметра объекта исходя из известных параметров этого объекта (предикторов) и большого набора похожих объектов, так называемой учебной выборки. Пример. Вот мы выбираем на базаре яблоко. Его можно описать такими предикторами: красность, вес, количество червяков. Но как потребителей нас интересует вкус, измеренный в попугаях по пятибалльной шкале. Из жизненного опыта нам известно, что вкус с приличной точностью равен 5*красность+2*вес-7*количество червяков. Вот про поиск такого рода зависимостей мы и побеседуем. Чтобы обучение пошло легче, попробуем предсказать вес девушки исходя из ее 90/60/90 и роста.
Читать полностью »

Итак, тема рейтинговых систем продолжает будоражить умы хабрапользователей. Появляются всё новые и новые схемы, формулы, тесты. И каждый раз всё сводится к одному и тому же вопросу: как совместить среднюю оценку пользователей с нашей уверенностью в этой оценке. Например, если один фильм получил 80 положительных и 20 отрицательных голосов, а другой — 9 положительных и 1 отрицательный, то какой из фильмов лучше? Не претендуя на создание новой универсальной рейтинговой системы, я всё же предложу один из возможных подходов к решению именно этого вопроса.

Читать полностью »

Всем привет! Поскольку мы работаем с малым бизнесом и наш стартап технологический, у нас имеется на руках некоторая статистика использования мобильных устройств. И подумали мы, что вам тоже интересно будет посмотреть сколько и каких устройств используется с нашими терминалами. Информация получилась любопытной. Приводим ее в виде легкой инфографики.

Какими устройствами пользуются владельцы 2can?Читать полностью »

На проходящем в Барселоне World Mobile Congress состоялась ежегодная презентация, в рамках которой аналитик IDC Саймон Бейкер привел итоговые результаты продаж смартфонов в России в 2012 году.
Как и отчеты других компаний (а недавно их делал и Kantar, и Евросеть, и МТС), он показывает новые продажи устройств, осуществленный в России. Соответственно, он не учитывает обычные мобильные телефоны (а их в России по прежнему под 70%) и не показывает уже имеющиеся на руках устройства (речь про новые продажи).

IDC посчитал рынок смартфонов в России
Читать полностью »

Дата майнинг 10 000 актёров порно

Вокруг adult киноиндустрии существует много мифов и заблуждений. Например, многие склонны думать, что типичная актриса — блондинка с пышными формами. На самом деле это далеко не так. Джон Миллворд (Jon Millward) осуществил дата-майнинг кинематографической базы Internet Adult Film Database и проанализировал информацию о 125 тыс. фильмах, которые содержат информацию более чем о 115 тыс. актёрах. Для статистического анализа были сделана выборка 10 000 человек.
Читать полностью »

Эта статья — продолжение первой части. В этой серии статей я рассматриваю применение набирающего популярность языка программирования R для решения распространенных статистических задач.

В данной и следующей статье я показываю как выбрать для обработки качественных и количественных данных правильные тесты и реализовать их в R. Данные методы позволяют получить реальное представление об объекте, процессе или явлении по какому-либо параметру, т.е. позволяют сказать «хорошо» или «плохо». Они не потребуют глубоких знаний программирования и статистики, и пригодятся людям различного рода деятельности.

Заинтересовались? Добро пожаловать под кат!
Читать полностью »

imageНет нет, ничего не случилось, все в порядке, но рассказать все таки решил, уверен, кому то это будет полезным.
У меня есть некоторое количество сайтов и так уж сложилось исторически, что практически на всех стоит счетчик liveinternet.ru. Да, я знаю о Яндекс метрике и аналитиксе, но привычка штука серьезная.

Иногда случается, что сайт умирает, становится не интересен или еще по какой-то причине закрывается а домен больше не продлевается. История знакомая многим и мне в том числе. После этого трагического события мне как то не приходило в голову, что нужно пойти на liveinternet.ru и сменить все свои данные. А зря…
Читать полностью »

Всем привет!

Какие последствия может иметь увеличение времени загрузки сайта всего на 1 секунду? Катастрофические! Например, для Amazon это могло бы обернуться недополучением 1,6 миллиарда долларов в год. Подробнее о том, почему стоит быть острожным с добавлением на сайт тяжелых фишек, снижающих его производительность, смотрите в ролике от Alconost Video.

Немного текста и длинная инфографика под катом.

Читать полностью »

«There are three kinds of lies: lies, damned lies, and statistics» © Бенджамин Дизраэли, 40-й премьер-министр Великобритании

Статистическая информация о данных в СУБД играет важную роль в производительности системы. С учетом ряда комментариев к прошлой статье, мы решили описать, зачем нужна статистика в СУБД Teradata, как она учитывается оптимизатором, на что влияет, и дать ряд практических советов по сбору статистики для тех, кто работает с нашей СУБД.Читать полностью »

Посвящается Энди Рубину, Рику Майнеру, Нику Сирсу и Крису Уайту.

image

Сейчас много любителей Android, имеющих, как минимум, одно устройство под его управлением, чуть меньше тех, кто просто немного пользовался системой, и уж точно нет почти никого, кто не слышал об этой популярной операционной системе.

Для представителей последней группы, непонятным образом оказавшихся на Хабре:

Google Android - это ...

построенная на основе Linux операционная система, преимущественно, для мобильных устройств с сенсорным управлением, таких как смартфоны и планшеты. По своей природе ОС является открытым ПО, распространяется по Apache лицензии на пользовательское окружение и по GNU лицензии на ядро, которые позволяют системе быть доступной для изменения и распространения производителями устройств и простыми пользователями.

Долго собирал разного рода информацию для себя по этой ОС с целью создания общей картины о ее месте на рынке мобильных устройств и перспектив.
Кроме того, статья содержит примеры использования нескольких полезных вэб-сервисов:

  • timeline.verite.co — создание интерактивного таймлайна на примере хронологии выпуска версий Android, бесплатно;
  • easel.ly — хороший и тоже бесплатный помощник для создания инфографики.

Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js