Рубрика «Статистика в IT» - 52

Введение

Сейчас практически невозможно представить себе мир без параллельных вычислений. Параллелят все и вся, даже у мобильных телефонов теперь несколько ядер, а значит… ну вы понимаете. Но давайте поговорим не о мобильных приложениях, а о более полезных и интересных вещах. О машинном обучении. Тема тоже модная, разрекламированная, про машинное обучение слышали даже домохозяйки и только ленивый еще не трогал это руками. Для машинного обучения, и если быть более точным, для статистических расчетов есть множество разных фреймворков, на мой вкус лучший из них – R (да простят меня поклонники Octave). И речь пойдет именно о нем.

Disclaimer:
я не претендую на особую строгость изложения, моя задача донести до читателей общую мысль.
Читать полностью »

Этот месяц богат содержательными отчётами (в частности, о трендах в сети, и будущем мобильных платформ ). Теперь, как раз в тему, Opera выпустила свежий отчет State of Web (предыдущий выходил в апреле), где рассказывает об использовании интернета с мобильных устройств, и включает список 10 самых популярных сайтов для большинства европейских стран.

Предпочтения мобильных пользователей разных стран совершенно не совпадают. В целом, в Европе более всего популярны новостные сайты (23 из 35 стран), а затем уже идут поисковики. Румыния и Испания более всего помешаны на спорте (но более всего мобильных спортивных фанатов — на Кипре). Кроме того, в десятке самых популярных:

  • Франция, Бельния, Италия и Македония: порталы для женщин;
  • Австрия, Болгария, Дания, Финляндия и Греция: прогнозы погоды;
  • Швеция: Больше всего любят новости, развлечения, покупки и объявления;
  • Финляндия и Болгария: сайты для молодых родителей;
  • Германия: Кулинарные рецепты.

Читать полностью »

Ключ к успеху при разработке free-to-play игр — анализ поведения игроков и постоянный тюнинг игрового функционала на основе статистики. Собрать статистику — это пол дела. Но как превратить гору сырых данных в информацию?

В моей прошлой статье я перечислила основные показатели, по которым можно отслеживать успешность игры. Во второй части цикла я сделаю обзор основных инструментов, которые помогут превратить данные в руководство к действию.Читать полностью »

На написание данной статьи меня сподвиг следующий топик: В поисках идеального поста, или загадки хабра. Дело в том, что после ознакомления с языком R я крайне искоса смотрю на любые попытки, что-то посчитать в экселе. Но надо признать, что и с R я познакомился лишь неделю назад.

Цель: Собрать средствами языка R данные с любимого HabraHabr'а и провести, собственно то, для чего и был создан язык R, а именно: статистический анализ.

Итак, прочтя этот топик вы узнаете:

  • Как можно использовать R для извлечения данных из Web ресурсов
  • Как преобразовывать данные для последующего анализа
  • Какие ресурсы крайне рекомендуются к прочтению всем желающим познакомиться с R поближе

Ожидается, что читатель достаточно самостоятелен, чтобы самому ознакомиться с основными конструкциями языка. Для этого как никак лучше подойдут ссылки в конце статьи.

Читать полностью »

Попробуй R

С утра я обнаружил у себя в почте приятный предновогодний сюрприз: Code School в коллаборации с O'Reilly выпустили бесплатный курс по языку R.

Курс выполнен в традициях Code School, т.е. его запросто можно пройти в браузере за пару-другую перерывов на кофе.
Читать полностью »

image

На днях App Annie опубликовала свежую статистику по анализу мобильного рынка приложений за последние восемь месяцев. Об увеличении выручки с Google Play на 311%, росте прибыли с восточного региона и доминировании азиатских паблишеров в мировом топе кассовых издателей читайте ниже (с полным переводом отчета можно ознакомиться на сайте App2Top.ru).Читать полностью »

imageНе так давно в одном из журналов я нашел заметку о том, на сколько «ботизированы» социальные сети, в первую очередь FB и VK: как оказалось, миллионные бюджеты, вложенные гигантами рынка в рекламу на этих ресурсах не оправдали себя, т.к. SMM-агентства накручивали голоса и лайки всеми возможными и невозможными путями. Зачем? Собственно ради этих самых миллионов (не голосов, конечно). В принципе, история не новая, т.к. были, например, скандалы подобного рода и с антивирусными компаниями, которые писали зловреды под свои продукты, если говорить о Сети, а если вспомнить недавний ипотечный крах, то можно понять, что и в «реальной» жизни всё ровно то же самое: эффект мыльного пузыря свойственен любому новому рынку.

Поэтому я решил проверить на зуб ту сферу, с которой работаю бок о бок каждый день – электронную коммерцию, а также связанные с ней области: платежи и их процессинг.
Читать полностью »

Последний доклад Организации экономического сотрудничества и развития (ОЭСР), посвящённый мировому рынку интернет-трафика, опубликованный 17 октября, состоит из 99 страниц, которые читаются, как увлекательный детектив. Он содержит подробные статистические данные об интернет провайдерах, точках обмена трафиком, росте пропускной способности интернета, механизмах самоорганизации, регулирующих всемирную сеть. Но я хочу остановиться на сравнении интернета и телефонных сетей, которое часто используется в докладе.

С момента своего появления интернет демонстрирует устойчивый экспоненциальный рост (сегодня 20 среднестатистических абонентов с широкополосным доступом генерируют столько же трафика, сколько весь интернет в 1995 году). Его пропускная способность намного превосходит возможности любых других глобальных систем связи. При этом цена трафика в международных точках обмена, в эквиваленте поминутной оплаты за голосовую связь, составляет 0.0000008 долларов в минуту — на пять порядков ниже, чем в телефонных сетях. Частично это объясняется технологическим превосходством сетей с коммутацией пакетов, но эта разница не настолько велика, тем более что телефонные сети уже давно используют пакетную коммутацию. Ключевое отличие в другом.
Читать полностью »

Любимое число %username%

Привет Хабражитель! Предлагаю принять участие в микроэксперименте.
Читать полностью »

Сегодня исполняется 7 лет со дня открытия веб-сервиса uCoz.
В связи с этим захотелось немного поделиться, уверен, интересной статистикой.
В начале пойдут цифры интересные, хотя немного хвалебные. А потом просто любопытные: число живых сайтов, половозрастная структура их создателей и т.п.

Отдельно надо сказать, что традиционно компании неохотно делятся подобной информацией, считают ее коммерческой тайной, а еще реже раскрывают методологию подсчетов, стараясь объявить максимально громкие и завышенные цифры.
В этом плане у Юкоза с самого начала была выбрана принципиально иная модель. Мы не завышали данные по числу сайтов в системе, заявляя только «живые». Эту традицию хочется продолжить.
Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js