Рубрика «статистика» - 107

Всем привет,

Хочу поделиться интересным исследованием на тему “что происходит за один день в Интернете”.

Кому лень читать — смотрите видео:

Кому нужны цифры — добро пожаловать под кат.

Читать полностью »

Сегодня исполняется 7 лет со дня открытия веб-сервиса uCoz.
В связи с этим захотелось немного поделиться, уверен, интересной статистикой.
В начале пойдут цифры интересные, хотя немного хвалебные. А потом просто любопытные: число живых сайтов, половозрастная структура их создателей и т.п.

Отдельно надо сказать, что традиционно компании неохотно делятся подобной информацией, считают ее коммерческой тайной, а еще реже раскрывают методологию подсчетов, стараясь объявить максимально громкие и завышенные цифры.
В этом плане у Юкоза с самого начала была выбрана принципиально иная модель. Мы не завышали данные по числу сайтов в системе, заявляя только «живые». Эту традицию хочется продолжить.
Читать полностью »

Каждый большой продукт включает в себя много сложных и интересных технологий, над созданием которых работали люди, зачастую посвятившие им целую жизнь. И в браузере Yandex реализованы многие разработки наших коллег, которые могут остаться не замеченными неспециалистами и казаться незначимыми деталями. Например, одной из облачных технологий Яндекса, которые интегрированы в Браузер, стал наш собственный переводчик.

Сам Яндекс.Перевод вышел из беты несколько месяцев назад. От других немногочисленных подобных сервисов его отличает автословарь, уникальная технология которого разработана командой лингвистов и программистов Яндекса. Во время его разработки удалось объединить современные статистические подходы машинного перевода и традиционные лингвистические инструменты.

Чтобы понять, насколько значимым шагом в развитии машинного перевода является появление автословаря, стоит вспомнить, что 20 лет назад были распространены синтаксические переводчики, для которых таблицы соответствия фраз на разных языках составляли вручную. Процесс их создания стал меняться только в конце 1990-х, когда появились первые статистические переводчики. Для обучения их моделям переводов стали использовать параллельные тексты. Документы, в которых одно и то же написано на разных языках, извлекали, например, из дипломатической документации. Большой базой параллельных текстов стали документы ООН. Но на подобной лексике создать общелексический переводчик не получилось, потому что даже неформальные тексты он переводил сухим дипломатическим языком.Читать полностью »

А ваше мнение на кинопоиске учитывается?

Наблюдая за одним из фильмов на кинопоиске, я обнаружил, как в один день неожиданно его рейтинг резко упал. Намеренно не буду указывать названий фильмов и ников пользователей, чтобы не вызвать непредвиденных последствий. Я попытался выяснить, в чем же причина, и обнаружил следующее: оказывается рейтинг рассчитывается не всегда одинаково. Все пользователи кинопоиска разделены на 2 сорта: оценки которых учитываются в рейтинге, и соответственно не учитываются. Изучив статистику, профили и историю оценок множества пользователей, и написав небольшую программу для анализа распределения оценок, я выяснил, как это происходит.
Читать полностью »

Некоторое время назад страничка «Лучшие комментарии» была удалена с Хабра (подробности здесь: habrahabr.ru/qa/18401/).
Тем не менее, мне бывало интересно туда заглянуть — и ради лулзов, и статьи иногда интересные попадаются из тех, что в ленте упустил. Так что решил я сделать свой небольшой сервис. Надеюсь, администрация не будет против.

Топ комментариев Хабра — сервис, детали реализации, и немного статистики (С#)
Читать полностью »

В это воскресенье, 30 сентября, все пользователи в России празднуют 14-тый День Интернета (не путать с Днем Рождения Рунета (7 апреля)).

В 1998-ом московская компания IT Infoart Stars предложила поддержать инициативу о создании этого праздника и провела первую «перепись русскоязычного населения» Интернета, согласно которой число российских пользователей составило 1 млн человек. С тех пор количество пользователей Интернета в России неуклонно возрастало. По данным Координационного центра национального домена сети Интернет, в этом году количество юзеров достигло 59 млн.

К 2012 году в русскоязычном сегменте сети Интернет (Рунете) стало больше не только пользователей, но и доменов. Например, домен .RU, основной национальный домен России, хорошо подготовился к празднику и неделю назад преодолел рубеж в 4 000 000 регистраций, в очередной раз подтвердив свое лидерство.

image

Читать полностью »

Двадцать шестой выпуск подкаста — Сливки IT R&D.
Проблемы с iPhone 5, Shazam сделал новую фичу, Надым и ты туда же, Цукерберг против и многое другое.

Читать полностью »

Вступление

Недавно обсуждал с девушкой-дизайнером, под какие же размеры экрана стóит рисовать сайты. Аргументы наши были, мягко говоря, необоснованными:
— У меня сайт на домашнем компьютере слишком широкий, надо сделать под широкий экран.
— Надо делать под маленькие экраны. Куча народа лезет в Интернет с мобильных устройств. Больших мониторов нет почти ни у кого.
— Да куча народу с такими мониторами! У всех моих знакомых мониторы большие.
— Да у тебя знакомые — дизайнеры да фотографы. А у народа таких мониторов нет!

Понятно, что нужны были более веские аргументы — пора обратиться к статистике.

Подсчёт

Существует некоторое количество сайтов, предоставляющих доступ к собранным данным о своих посетителях. Один из таких сайтов — бывший SpyLog, а ныне — Openstat, выдающий и отчёт о разрешающей способности экранов. Данные там, на первый взгляд, не очень полезны: знание того, что самое популярное разрешение — 1366×768 — встречается у 19 процентов посетителей, мне мало поможет. Но мы можем получить эти данные в виде отдельного файла, который можем обработать. Доступны 4 формата — PDF, XLS и два текстовых: CSV и Tab separated, названный здесь tsv, который мы и возьмём.

Читать полностью »

Nominet, администратор национального домена Великобритании .UK, провел опрос среди 530 компаний на тему внедрения новых доменов верхнего уровня. В число респондентов вошли наиболее известные представители фирмы Великобритании, занимающиеся как крупным, так и средним и мелким бизнесом, и имеющие собственный сайт в интернете. Читать полностью »

Оценить распространенность пиратства в странах — задача нетривиальная и многие агентства представляют цифры, взятые с потолка. Но можно оценить распространенность конкретных технологий файлового обмена, используемых, преимущественно для пиратства.
Речь пойдет о DHT для BitTorrent'a.
Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js