Рубрика «Статистика в IT» - 10

Хабра-детектив: они дружат с НЛО - 1
Вы ведь знаете, что НЛО заботится о вас? Ну, во всяком случае, об этом регулярно напоминают в публикациях редакторского отдела Хабра — новостях на околополитические, околоскандальные и другие околотемы.

Давайте выясним, как часто редакторы используют эту стандартную "заглушку" и для каких именно публикаций? А также выполним и другие пожелания из комментариев к предыдущему Хабра-детективу о редакторах.

Итак, когда же у вас, Хабра-пользователи, возникают "противоречивые чувства", которые вы не можете сдержать и высказываете в комментариях? А самое главное — что их вызывает? Начнём наше новое расследование!

Читать полностью »

Недавно в статье Великий порноэксперимент: история Интернета для взрослых, мы затронули важную для всех тему, однако упустили полноценную историческую часть, которая не менее важна и интересна, и пожалуй, заслуживает двух отдельных публикаций.

«Интернета просто бы не существовало без порно и Стартрека» — Рик Берман, продюсер телесериала «Звездный путь».

Disclaimer. В статье присутствуют изображения эротического содержания и полностью отсутствует какой-либо порнографический контент. Рассказывается о том, какое развитие обеспечил контент для взрослых в целом для медиаиндустрии и для сети Интернет после её рождения. Вы узнаете историю от порно-театров до наших дней, почему VHS победил BetaMax, о том, как «сисопы» заработали свои первые миллионы долларов на эротическом контенте, распространяя его миллионам человек еще до того, как появился Интернет, то есть тогда, когда в Интернете ещё никого не было. А также то, как Амазон и многие другие онлайн-корпорации, использовали модель Леви для работы с партнёрами, применявшуюся на ранних сайтах для взрослых, и то что двухфакторная идентификация впервые была изобретена для того, чтоб защитить пользователей от нежелательных порнографических email-рассылок, а не только для повышения безопасности.

Читать полностью »

7 лет хайпа нейросетей в графиках и вдохновляющие перспективы Deep Learning 2020-х - 1

Новый год все ближе, скоро закончатся 2010-е годы, подарившие миру нашумевший ренессанс нейросетей. Мне не давала покоя и лишала сна простая мысль: «Как можно ретроспективно прикинуть скорость развития нейросетей?» Ибо «Тот, кто знает прошлое — тот знает и будущее». Как быстро «взлетали» разные алгоритмы? Как вообще можно оценить скорость прогресса в этой области и прикинуть скорость прогресса в следующем десятилетии? 

7 лет хайпа нейросетей в графиках и вдохновляющие перспективы Deep Learning 2020-х - 2

Понятно, что можно примерно посчитать количество статей по разным областям. Метод не идеальный, нужно учитывать подобласти, но в целом можно пробовать. Дарю идею, по Google Scholar (BatchNorm) это вполне реально! Можно считать новые датасеты, можно новые курсы. Ваш же покорный слуга, перебрав несколько вариантов, остановился на Google Trends (BatchNorm)

Мы с коллегами взяли запросы основных технологий ML/DL, например, Batch Normalization, как на картинке выше, точкой добавили дату публикации статьи и получили вполне себе график взлета популярности темы. Но не у всех тем путь усыпан розами взлет такой явный и красивый, как у батчнорма. Некоторые термины, например регуляризацию или skip connections, вообще не получилось построить из-за зашумленности данных. Но в целом тренды собрать удалось.

Кому интересно, что получилось — добро пожаловать под кат!
Читать полностью »

Хабра-детектив: 24 часа из жизни 24 публикаций - 1
Вы ведь смотрите на рейтинги статей перед тем, как их читать? Теоретически, это совсем не должно влиять на ваше отношение к каждому отдельному посту, но влияет. Также, автор публикации не должен бы иметь значения, если статья интересная, но и он влияет на наше отношение к тексту ещё до того, как мы начнём читать.

Когда-то на Хабре часто встречались комментарии "Не смотрел на автора до прочтения, но угадал, что это alizar / marks". Помните? Ведь это не честно. Вдруг кто-то написал замечательный текст / заметку, а её даже не попробуют прочитать.

Восстановим справедливость? Или докажем предвзятость? Сегодняшний детектив — набор историй о 24 публикациях разных авторов и на разные темы, но ведь нам интересно, что же на самом деле происходит с текстами после их публикации.

Читать полностью »

В первой части была рассмотрена некоторая статистика и опубликован рейтинг статей этого сайта. Во второй части будут рассмотрены другие статистические закономерности этого года, которые мне показались интересными, а также будет опубликован рейтинг авторов за этот, 2019 год.

Хабрарейтинг 2019: статистика и рейтинг авторов за 2019 год - 1

Первая часть рассчитана на читателей сайта, эта будет более интересна авторам, но и остальные надеюсь, найдут что-нибудь полезное — статьи авторов, попавших в рейтинг, определенно имеет смысл прочитать.

Продолжение под катом.
Читать полностью »

Заканчивается 2019 год, и пора подвести итоги и собрать статистику и рейтинг наиболее интересных статей Хабра за этот период. Предыдущий рейтинг можно прочитать здесь, надеюсь новый будет еще более интересным.

Хабрарейтинг 2019: статистика и рейтинг лучших статей за 2019 год - 1

Парсинг и обработка данных были за этот год улучшены (кстати, изображение на КДПВ сгенерировано на базе заголовков статей), так что надеюсь, результаты будут более интересными. Также я добавил две новые категории в рейтинге — теперь отдельно будут рассматриваться хабы «ИТ-эмиграция» и «Здоровье», думаю, для многих и то и то может быть актуально.

Продолжение и результаты под катом.
Читать полностью »

Хабра-детектив: тайна редакторов новостей - 1
Вы ведь знаете, что у Хабра есть редакторы? Те, которые люди. Именно благодаря им новостном раздел никогда не пустеет, а у вас всегда есть возможность пошутить про наследие alizar.

На счету редакторов десятки публикаций в неделю на каждого. Иногда, пользователи Хабра даже предполагают, что те на самом деле не люди, а просто алгоритмы по поиску и адаптации материалов.

Сегодня мы попробуем узнать, какой же продолжительности их рабочий день, отдыхают ли они вообще и бывает ли у них отпуск. А может всё-таки они роботы? Как минимум, некоторые. Новая детективная история на Хабре. Будет интересно. Начнём!

Читать полностью »

Аналитики компании Picodi сравнили цены на услуги проводного доступа в интернет 233 провайдеров из 62 стран мира - 1

Аналитики портала Picodi.com изучили коммерческие предложения 233 крупнейших поставщиков безлимитного домашнего оптоволоконного интернета в 62 странах мира и ответили на вопросы: насколько обременителен для бюджета доступ к интернету сегодня; где веб-серфинг стоит дешевле всего; где можно рассчитывать на суперскоростной интернет; действительно ли в России недорогой интернет. Данное исследование было опубликовано 10 декабря 2019 года, в нем приняли участие провайдеры из 62 стран, включая страны Большой двадцатки, крупнейшие англо- и испаноязычные страны, а также страны бывшего СССР.
Читать полностью »

Экономия – одна из главных причин, по которой компании переходят на Аутсорсинг печати. С этим соображением они выбирают того подрядчика, который предложит самую низкую цену за отпечаток. И сегодня я, Игорь Челебаев, эксперт по оптимизации офисной печати с 27-летним стажем, расскажу, как аутсорсерам удается накручивать сумму счета, и как все-таки рассчитать реальную стоимость печати и узнать правду.

image

Как «считают» аутсорсеры

За 27 лет работы «Бюро офисных машин» мы поняли, что предела человеческой изобретательности нет. Компании-заказчику нужны конкретные цифры: вот столько копий они напечатали за месяц, столько стоит один отпечаток, столько составила общая сумма выплат за покопийную печать. И аутсорсер дает ему эти данные. Но откуда он их берет? Какая разница, ответит руководитель, если в итоге сумма затрат вышла меньше, чем до аутсорсинга.

Но разница есть, когда руководитель вдруг неожиданно узнает, что мог бы экономить в 2-3 раза больше. И экономил бы, если бы аутсорсер для подсчета использовал правильные инструменты. Но об этом позже.

Так как же они считают?
Читать полностью »

Сайты для взрослых, или простым языком, порносайты, занимают ключевое место во Всемирной паутине и её развитии. Если вспомнить недавний сериал «Холивар. История рунета. Часть 1. Начало: хиппи из Калифорнии, Носик и лихие 90-е» и термин «две девушки в час», «то есть это тогда, когда было fido, были модемы 1200 бит, и вот ты сидел и у тебя в час две картинки девушек эротического содержания проходило», становится очевидным, что трафик для взрослых сыграл свою немаловажную роль. Ведь зачем ещё развивать сети, если не для стриминга порно?

Знаете ли вы какой % мирового трафика составляет порнография и какой сумме он эквивалентен в долларах США в год? Какие ухищрения придумывают порносайты и какого типа бывают проекты для привлечения своей аудитории? Несёт ли порно вред или пользу?

Отдельные разделы нашего рассказа мы посвятим «Великому порноэксперименту» и приведём научные факты и данные, которые говорят, как о пользе, так и о вреде порно. Бесконечная новизна! Эффект Ку́лиджа и последствия воздействия на не окрепшую психику или наоборот помощь в формировании устойчивой и более окрепшей психики? С помощью интернет-порно парень может увидеть больше горячих девушек за 10 минут, чем его предки могли за несколько жизней. Проблема в том, что у парня мозг охотника-собирателя.Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js