Привет. Прошло уже почти полгода как я сделал новостной агрегатор каналов в Телеграме с открытым исходным кодом. Краткую статью про него можно прочитать на VC. Здесь же я бы хотел поделиться некоторыми интересными вещами, которые я нашёл в данных за всё время работы агрегатора.
Рубрика «анализ данных» - 4
Анализ различий подачи новостей в Telegram-каналах
2022-08-27 в 11:19, admin, рубрики: data mining, natural language processing, python, агрегатор новостей, анализ данных, визуализация данных, машинное обучение, Новости, обработка естественного языка, тегиниктонечитаетКак врать с помощью статистики
2022-04-12 в 6:32, admin, рубрики: python, анализ данных, визуализация данных, Программирование, статистика"Существуют три вида лжи:
-
ложь;
-
наглая ложь;
-
пропагандастатистика; -
источник цитаты в интернете".
Марк Твен(ну или не он).
В данной статье на рассмотрим, как можно быстро доказать следующие утверждения, смотря на один и тот же источник данных:
-
Лошади бегают по часовой стрелке быстрее чем по часовой.
-
Лошади бегают против часовой стрелки быстрее чем по часовой.
10 лучших бесплатных OSINT-инструментов по версии компании T.Hunter
2022-03-04 в 11:16, admin, рубрики: OSINT, анализ данных, Блог компании T.Hunter, защита информации, информационная безопасность, поиск информации в сети, социальные сетиПриветствую Хабр. На связи T.Hunter. Недавно у нас в офисе разгорелся спор – наберется ли хотя бы 10 сносных и, самое главное, БЕСПЛАТНЫХ инструментов для проведения OSINT?
Техническая разведка
2022-02-12 в 9:32, admin, рубрики: анализ данных, Анализ и проектирование систем, Блог компании Timeweb Cloud, история, Научно-популярное, разведка, техническая разведка, ЦРУ, Читальный залПолучаем кривую плотности распределения вероятности… быстрее и точнее
2021-11-04 в 13:12, admin, рубрики: python, Алгоритмы, анализ данных, математика, математическая статистика, плотность вероятностиНедавно на Хабре вышла статья за авторством MilashchenkoEA Читать полностью »
Получаем кривую плотности распределения вероятности случайного (или нет) процесса
2021-10-24 в 18:07, admin, рубрики: matplotlib, python, Алгоритмы, анализ данных, Анализ и проектирование систем, математика, математическая статистика, моделирование, Программирование, статистический анализВ ходе моей трудовой деятельности неоднократно возникала необходимость построить кривую плотности распределения вероятности по имеющемуся набору числовых данных большого объема различной природы, как случайных, так и не очень. Бывало и такое, что по некоторым причинам, использовать при этом сторонние библиотеки, решающие вопрос, было нежелательно. Приходилось обходится своими силами.
Как определить самый авторитетный фильм всех времен и народов
2021-09-17 в 10:28, admin, рубрики: data mining, python, анализ данных, графы, исследование, кино, парсингКакое произведение киноискусства оставило самый большой отпечаток в современной поп культуре? Предлагаю подумать над этим вопросом некоторое время. Может быть это Апокалипсис сегодня? Или Крестный отец? А вдруг главный фильм всех времен и народов это шедевр отечественного кинематографа - фильм Викинг?
К счастью, это можно посчитать.
Отсылки в современных произведениях популярного искусства - забавная вещь. Люди их любят. Возьмем популярный мультсериал Читать полностью »
Я выпустил Grafar — JS-библиотеку для визуализации
2021-05-11 в 8:26, admin, рубрики: 3d, javascript, WebGL, анализ данных, визуализация, визуализация данных, математика, Разработка веб-сайтов, реактивность, фронтендЯ опенсорснул grafar — свою библиотеку для визуализации. Основная часть кода написана в 2013–2016 годах для моего диплома. Следующие 5 лет проект пролежал в столе — я был не вполне доволен АПИ, было много классных функций, которые я мог добавить, работа засасывала, и ещё тысяча причин не выпускать его пока, ну вы знаете. В конце концов, на свете есть столько людей поумнее меня, и они точно придумают что-то получше, правда же?
Заметки Датасатаниста: что делать, если перед вами оказалась NP-полная задача
2020-11-25 в 13:15, admin, рубрики: big data, data mining, data science, fairness, machine learning, ruvds_статьи, анализ данных, Блог компании RUVDS.com, машинное обучение, честностьНаверное, каждый сталкивался с тем, что приходилось столкнуться с какой-то сложной задачей, решение к которой не удавалось подобрать не то что сразу — а даже после долгих упорных часов работы или дней. Об одном из классов таких задач — NP-полных, мы сегодня и поговорим.
А вообще реально ли встретить такие задачи в обычной жизни? На самом деле, они возникают в огромном ряде случаев: комбинаторика, графы и сети, выполнение логических формул, работа с картами, оптимальные загрузки, отображения, задачи дискретной оптимизации, нахождение самых длинных последовательностей, поиск равных сумм и многие задачи на множества! И это далеко не полный список.
Под катом неформальный гайд — как понять, что перед вам может быть NP задача и что делать, если это именно она и оказалась. Сегодня мы атакуем этот вопрос с практической стороны.
Читать полностью »