Рубрика «Статистика в IT» - 53

Каждый большой продукт включает в себя много сложных и интересных технологий, над созданием которых работали люди, зачастую посвятившие им целую жизнь. И в браузере Yandex реализованы многие разработки наших коллег, которые могут остаться не замеченными неспециалистами и казаться незначимыми деталями. Например, одной из облачных технологий Яндекса, которые интегрированы в Браузер, стал наш собственный переводчик.

Сам Яндекс.Перевод вышел из беты несколько месяцев назад. От других немногочисленных подобных сервисов его отличает автословарь, уникальная технология которого разработана командой лингвистов и программистов Яндекса. Во время его разработки удалось объединить современные статистические подходы машинного перевода и традиционные лингвистические инструменты.

Чтобы понять, насколько значимым шагом в развитии машинного перевода является появление автословаря, стоит вспомнить, что 20 лет назад были распространены синтаксические переводчики, для которых таблицы соответствия фраз на разных языках составляли вручную. Процесс их создания стал меняться только в конце 1990-х, когда появились первые статистические переводчики. Для обучения их моделям переводов стали использовать параллельные тексты. Документы, в которых одно и то же написано на разных языках, извлекали, например, из дипломатической документации. Большой базой параллельных текстов стали документы ООН. Но на подобной лексике создать общелексический переводчик не получилось, потому что даже неформальные тексты он переводил сухим дипломатическим языком.Читать полностью »

22 октября американская аналитическая компания Flurry выпустила очередной отчет, посвященный изучению пользовательской вовлеченности. На Хабре уже мелькал голый перевод статьи, но мы в компании решили его проанализировать и в этом посте поделимся результатами.

По данным, полученным при изучении более 230 000 приложений, зарегистрированных в системе, была построена «матрица вовлеченности»: все приложения разделены на категории и ротированы в зависимости от частоты использования в неделю и % пользователей, которые продолжают пользоваться приложением по истечении 90 дней.

image

Как видно из таблицы, наилучшими показателями вовлеченности обладают приложения, имеющие социальную составляющую (социальные сети и многопользовательские игры, знакомства и различные im-сервисы), что и неудивительно. В зависимости от типа приложений, американские аналитики даже рекомендуют оптимальный вид монетизации. Так для приложений с высокой частотой использования, но небольшим процентом возвращений (квадранты II и III) — это платные приложения и in-app purchase, а для приложений с высокой долей возвратов (I и IV) — рекламная модель.

Но даже больший интерес, на наш взгляд, представляют не сами эти данные, а сравнение их с аналогичным отчетом компании за 2009 год.
Читать полностью »

    Я посвящаю этот пост всем тем программистам, которые считают, что своим высоким зарплатам они обязаны исключительно своими умственными способностями, а также молодым людям, которые хотят «выучиться на программиста, так как им больше платят». Я не буду утверждать, что высоких зарплат в отрасли нет потому, что они таки там есть, но распишу почему они есть далеко не у всех. И почему даже хорошая квалификация не гарантирует хорошую зарплату.

                                    Трэш-капитализм в действии

Перед тем как вы начнете читать это, замечу, что автор не имеет экономического образования, а все его мысли про экономику базируются на прогулянных школьном и университетском курсах экономики, отрывках из бредовых снов, материалах журнала Yes!, а также постах (около)политических форумов. Поэтому, если по прочтении этого поста у вас возникнет чувство несогласия с автором, то просто не воспринимайте прочитанное всерьез.
Читать полностью »

11 сентября сайт vk.com переходит с TNS на LiveInternet и ComScore, а также раскрывает свою статистику посещений, которую можно посмотреть тут. Из этой статистики мне показалось интересным статистика по браузерам, OC и разрешениям экранов.

Читать полностью »

Наблюдая за появлением огромного количества IT стартапов во всем мире, большая часть которых сосредоточена в Северной Америке, Европе и Азии, и видя их взрывной рост стоимости, часто в десятки раз от первоначального размера за короткие промежутки времени, мне становиться интересно понять причины этого явления. Имея экономическую подготовку и кое-какие знания в этой области, я всегда старался постичь базовые механизмы, заложенные в подобных явлениях. Что является двигателем в этих событиях, а также где берётся топливо для всё большего и большего разгона этого явления? Откуда такой энтузиазм в прогнозах и почему венчурные инвесторы так охотно вкладываются в молодой, неокрепший бизнес, будучи твердо убеждены, что когда-нибудь это принесет им прибыль, намного превышающую прибыль от вложений в другие инструменты для инвестирования? В конце концов, откуда берутся деньги у этих самых венчурных инвесторов, чтобы так щедро вкладывать их в стартапы? И самый главный вопрос – неужели вопли паникёров «IT загибается»TM, которые я раньше постоянно слышал, не имеют под собой реальной основы?
Читать полностью »

Однажды в магазин Target зашел мужчина и потребовал вызвать менеджера. В своих руках он сжимал огромную кипу купонов магазина, полученных его дочерью.

«Моя дочь получила это по почте! – прокричал он. – Она еще в школу ходит, а вы посылаете ей купоны на детскую одежду и памперсы? Да как вы смеете! Вы хотите таким способом побудить школьниц рожать?»

Менеджер посмотрел на пачку купонов на материнскую одежду, детскую мебель – действительно, они были адресованы дочери рассерженного мужчины. Менеджер принес свои извинения.

Через несколько дней он позвонил мужчине, чтобы еще раз извиниться. По телефону голос отца звучал растерянно. «Знаете, я серьезно поговорил с дочерью, и выяснилось, что в моем доме происходило то, о чем я совершенно не догадывался. Она рожает в августе. Примите мои извинения».

Как Target узнал, что дочь беременна до того, как об этом стало известно ее отцу? Ответ прост – благодаря системе прогнозирования беременности (pregnancy prediction system), разработанной аналитиком компании Эндрю Полом. Под катом – обо всем по порядку.
Читать полностью »

Однажды в магазин Target зашел мужчина и потребовал вызвать менеджера. В своих руках он сжимал огромную кипу купонов магазина, полученных его дочерью.

«Моя дочь получила это по почте! – прокричал он. – Она еще в школу ходит, а вы посылаете ей купоны на детскую одежду и памперсы? Да как вы смеете! Вы хотите таким способом побудить школьниц рожать?»

Менеджер посмотрел на пачку купонов на материнскую одежду, детскую мебель – действительно, они были адресованы дочери рассерженного мужчины. Менеджер принес свои извинения.

Через несколько дней он позвонил мужчине, чтобы еще раз извиниться. По телефону голос отца звучал растерянно. «Знаете, я серьезно поговорил с дочерью, и выяснилось, что в моем доме происходило то, о чем я совершенно не догадывался. Она рожает в августе. Примите мои извинения».

Как Target узнал, что дочь беременна до того, как об этом стало известно ее отцу? Ответ прост – благодаря системе прогнозирования беременности (pregnancy prediction system), разработанной аналитиком компании Эндрю Полом. Под катом – обо всем по порядку.
Читать полностью »

Аналитик Гораче Дедью (Horace Dediu) из компании Asymco составил диаграмму, на которой нестандартным способом сравнивает количество продаж компьютеров под Windows и Mac OS за каждый год с 1984 по 2011.

Мультипликатор продаж PC/Mac опустился до уровня 1985 года

Н а диаграмме видно, как Apple начала резко сдавать позиции после выхода Windows 95, при этом пик доминирования Microsoft пришёлся на 2004 год, когда было продано 182,5 млн PC и 3,25 млн «маков».
Читать полностью »

Аналитик Гораче Дедью (Horace Dediu) из компании Asymco составил диаграмму, на которой нестандартным способом сравнил количество продаж компьютеров под Windows и Mac OS за каждый год с 1984 по 2011.

Соотношение продаж PC/Mac опустилось до уровня 1985 года

На диаграмме видно, как Apple начала резко сдавать позиции после выхода Windows 95, при этом пик доминирования Microsoft пришёлся на 2004 год, когда было продано 182,5 млн PC и 3,25 млн «маков».
Читать полностью »

«Население» Интернета уже больше 2 миллиардов человек. Что успевает сделать такое количество людей за минуту? Вот некоторые цифры:

за одну минуту —

  • пользователи заливают на Youtube 48 часов видео;
  • делают 2 миллиона запросов к Google;
  • тратят в онлайн-магазинах 272 070 долларов;
  • загружают 3125 фотографий на Flickr;
  • создают 571 веб-сайт;
  • отправляют 100 000 твитов;

Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js