Рубрика «Статистика в IT» - 42

Рынок соцсетей уже пару лет как поделен и относительно стабилен, сейчас основная движуха идет на рынке мгновенных сообщений на смартфонах и планшетах. Интересно, какова ситуация в гиковой русскоязычной среде. Предыдущий в чем-то аналогичный опрос на Хабре: Общение в интернете: раньше и теперь.
Читать полностью »

Анализируем странные корреляции

Недавно заметил в ленте фейсбука ссылку на статью с кучей примеров «странных корреляций» как на картинке. Первоисточник оказывается здесь, и там таких примеров штук 20. Решил по-практиковаться в статистике и проверить насколько эти корреляции удивительны на самом деле.

Заинтересованных прошу под кат.
Читать полностью »

Статистика Github
О публикации кода на Github или другом открытом хостинге часто говорят, как о такой живительной эвтаназии, после которой патчи, фиксы, сообщения о проблемах и прочие коммиты от сторонних разработчиков польются рекой. У меня пока противоположный опыт. В парочку моих относительно заметных проектов вообще никто и ничего реально не привнес, не говоря уж об остальных проектах. Более того, я несколько раз делал очень серьезные изменения/улучшения в чужие проекты, но их авторы морозились и не приняли изменения. Исходя из этого я развил теорию: мол, вся эта открытость и коллаборация — это красивые слова, реально все пилят что-то свое и зарабатывать деньги или пиар кому-то другому совершенно не горят желанием. Чтобы проверить теорию, я посчитал кое-какую статистику по всем репозиториям на Github, у которых больше 700 звездочек, таких чуть больше 4 тысяч.

Читать полностью »

В последнее время на Хабре появляется все больше постов о целесообразности проведения А/Б тестирований (об их пользе, увеличении конверсий). Если внимательно следовать инструкциям — получается очень интересная вещь: незначительное изменение интерфейса и логики вывода информации может привести к значительному изменению конверсии, если перемножить все цифры конверсий под подобным катом — то можем получить рост и в 2 раза.

Уже представляю себе десятки, а то и сотни вебмастером и менеджеров, которые проверяют с помощью А/Б тестов каждое изменение своего проекта, заказывают аудит в usability-лабораториях и ждут роста конверсий в пресловутые 2 раза. Что происходит на самом деле — давайте разберемся…
Читать полностью »

Поисковик Shodan ориентирован не на поиск информации в интернете, а на поиск информации о самой глобальной сети, точнее — об устройствах, подключённых к ней. С помощью Shodan можно искать веб-камеры, серверы, роутеры и любую другую технику, имеющую выход в интернет, вплоть до систем уапрвления промышленным оборудованием, электростанциями или светофорами — причём многие из этих систем имеют весьма слабую защиту от вторжений (или не имеют её вообще)

Недавно владелец Shodan Джон Мэзерли решил составить карту всех устройств, имеющих IPv4-адрес в Интернете. На то, чтобы пропинговать все доступные устройства с прямым выходом в интернет ушло чуть меньше пяти часов. Обработка данных и рендеринг карты заняли двенадцать часов.

Владелец поисковика Shodan пропинговал весь интернет и составил его карту
Читать полностью »

Когда в твоём распоряжении миллионы пользователей — видимо, не так просто удержаться от соблазна поэкспериментировать над ними. Уже «Фейсбук» извинился за то, что управлял настроением своих пользователей, формируя новостную ленту. Следом за ними расчехлился крупный сайт знакомств OkCupid, в блоге которого вчера появилось описание трёх социальных экспериментов, которые ставились над его пользователями.

Сайт знакомств подкручивал совместимость профилей, чтобы стимулировать активность — и ещё два эксперимента над пользователями
Читать полностью »

Пишем простую систему рекомендаций на примере Хабра
Сегодня мы поговорим о рекомендательных системах, а точнее о самой простой форме коллаборативной фильтрации. В программе передач: что такое рекомендательная система, на чем основана, каков математический аппарат и как её можно воплотить в код. В качестве бонуса предоставим результаты в виде простого сервиса.

  1. Что такое рекомендательная система
  2. Интуиция
  3. Теория
  4. Реализация: код и данные
  5. Сервис Хабра-рекомендаций
  6. Хабра-аналитика

Читать полностью »

Патентные тролли подают 67% всех патентных исков в США

Проблема патентных троллей становится настолько серьёзной, что её невозможно игнорировать.

2013 год поставил абсолютный исторический рекорд по количеству нарушений патентного законодательства, сообщается в последнем отчёте аналитической компании PricewaterhouseCoopers, которая уже 19 лет собирает статистику по патентам и связанным с ними судебным делам.

Аналитики PwC считают, что причина — в бурной активности патентных троллей, которые скупают патенты, не занимаясь никакой производственной деятельностью.
Читать полностью »

Последнюю пару недель внимательно слежу за работой Хабра с помощью Хабра-аналитики и решил собрать свои наблюдения в статью. Сегодня мы обсудим: когда и в каком количестве читают Хабр; что такое «синдром ступеньки»; как получить данные о своих статьях и чем можно провести их анализ.

  1. Статистика посещаемости
  2. Просмотры статей: синдром ступеньки
  3. Публичность данных
  4. Хотлинк Хабра-графиков
  5. Весь инструментарий онлайн

Статистика посещаемости


Синдром ступеньки и срез посещаемости Хабра
(интерактивная версия доступна здесь и, если сайт упадет, то здесь)
Читать полностью »

Несколько дней назад ребята из службы исследований HeadHunter решили немного развлечься и посмотрели, кто в мире IT считает себя самым ответственным, коммуникабельным, работоспособным, быстрообучаемым и самостоятельным. Другими словами, кто не смущается употреблять эти популярные, емкие, содержательные и «так любимые рекрутерами» характеристики в своем резюме.

Для сравнения мы взяли список профессий, названия которых работодатели наиболее часто вводят при поиске резюме в сфере информационных технологий. Проанализировано 87,5 тыс. резюме, размещенных или обновленных в первом полугодии.

Важно, от редакции: то, что люди говорят или не говорят о себе в резюме — не всегда значит, что они такие или не такие на самом деле :)

О своей ответственности тестировщики и бизнес-аналитики говорят в резюме вдвое чаще, чем программисты java и C++. Возможно, они считают, что в их профессии эти качества приоритетнее?
Самые работоспособные, ответственные и коммуникабельные

А как обстоят дела с коммуникабельностью?
Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js