Продолжаем разговор. Прошлая статья была переходной от предыдущего цикла о графических моделях вообще (часть 1, часть 2, часть 3, часть 4) к новому мини-циклу о тематическом моделировании: мы поговорили о сэмплировании как методе вывода в графических моделях. А теперь мы начинаем путь к модели латентного размещения Дирихле (latent Dirichlet allocation) и к тому, как все эти чудесные алгоритмы сэмплирования применяются на практике. Сегодня – часть первая, в которой мы поймём, куда есть смысл обобщать наивный байесовский классификатор, и заодно немного поговорим о кластеризации.
Рубрика «классификация» - 6
Вероятностные модели: от наивного Байеса к LDA, часть 1
2014-07-02 в 10:49, admin, рубрики: data mining, байесовские сети, Блог компании Surfingbird, искусственный интеллект, классификация, кластеризация, математика, математическое моделирование, теория вероятностейПроблема холодного старта персонализации новостной ленты
2014-06-26 в 8:31, admin, рубрики: data mining, Алгоритмы, Блог компании FAVORaim, генетический алгоритм, искусственный интеллект, классификация, Программирование, метки: data mining, генетический алгоритм, искусственный интеллект, классификацияСегодня мы хотели бы рассказать о своем исследовании в области персонализации новостной ленты в рамках проекта favoraim. Сама идея показывать пользователю только те новости (далее записи), которые будут ему интересны, не новая и вполне естественная. Для решения этой задачи есть устоявшиеся и хорошо зарекомендовавшие себя модели.
Принцип работы этих алгоритмов похож: мы анализируем реакцию пользователей (feedback) на предыдущие записи и пытаемся прогнозировать его реакцию на текущие события. Если реакция «положительная», событие попадает в ленту, если «отрицательная» — не попадает. Читать полностью »
Классификация с использованием муравьиного алгоритма
2014-04-29 в 18:20, admin, рубрики: data mining, классификация, муравьиные алгоритмы, метки: классификация, муравьиные алгоритмы На хабре уже был рассмотрен муравьиный алгоритм, позволяющий используя простые правила решить задачу поиска оптимального маршрута. В данной статье рассмотрено применение этого алгоритма к задаче классификации.
Читать полностью »
Обработка цифровых снимков в ДЗЗ (дистанционном зондировании земли)
2014-01-30 в 8:18, admin, рубрики: Алгоритмы, ДЗЗ, классификация, обработка изображений, сканеры, метки: ДЗЗ, классификация, сканеры На Хабре было немало статей про использование различных методов обработки изображений, включая классификацию данных, фильтрацию. Многие из этих подходов применяются и в дистанционном зондировании при обработке цифровых изображений Земли.
От момента, как снимок получен со спутника, до возможности его анализировать должен пройти целый цикл процедур по приведению его в вид, удобный для получения и последующего анализа визуальной информации.
Тех, кому интересен сам процесс, прошу под кат (трафик):Читать полностью »
Линейная регрессия на пальцах в распознавании
2013-12-10 в 5:06, admin, рубрики: data mining, Алгоритмы, классификация, линейная регрессия, распознавание образов, метки: классификация, линейная регрессия, распознавание образов В задаче распознавания ключевую роль играет выделение значимых параметров объектов и оценка их численных значений. Тем не менее, даже получив хорошие численные данные, нужно суметь правильно ими воспользоваться. Иногда кажется, что дальнейшее решение задачи тривиальное, и хочется «из общих соображений» получить из численных данных результат распознавания. Но результат в этом случае получается далеко не оптимальный. В этой статье я хочу на примере задачи распознавания показать, как можно легко применить простейшие математические модели и за счет этого существенно улучшить результаты.
Читать полностью »
Машинное обучение для самых маленьких
2013-08-06 в 11:58, admin, рубрики: big data, искусственный интеллект, классификация, машинное обучение, метки: искусственный интеллект, классификация, машинное обучение На сегодняшний день мне неизвестны доступные и легко понятные для непосвященного читателя книги по машинному обучению на русском языке. По теме написано много хороших трудов на английском, но по каким-то причинам они не переведены. Данной серией статей я преследую цель сдвинуть вектор ситуации в лучшую сторону. Если читатели положительно воспримет статью, я, по мере сил, постараюсь сделать замкнутый цикл статей по машинному обучению. Целевая аудитория — люди, желающие ознакомиться с основными задачами и методами машинного обучения, и в дальнейшем, возможно, углубить свои знания самостоятельно. Идеальный читатель знаком с основами языка программирования Python и библиотеки NumPy или желает в них разобраться. Я постараюсь свести количество математики и простыней из формул к минимуму без ущерба для качества преподносимого материала. Заинтересованный читатель всегда может узнать математическую поднаготную каждого метода в википедии, на machinelearning.ru или в соответствующей литературе.
Читать полностью »
Классификация механизмов аутентификации и их обзор
2013-04-22 в 14:27, admin, рубрики: аутентификация, информационная безопасность, классификация, научная работа, метки: аутентификация, классификация, научная работа Во время написания своей диссертации по защите информации, посвященной разработке нового алгоритма аутентификации, передо мной встала задача классифицировать существующие механизмы аутентификации, чтобы можно было определить к какому классу относится моя разработка.
Я столкнулся с тем, что никакой общепринятой классификации нет, и у каждого автора она своя, если она вообще есть. Поэтому я предлагаю вам свою классификацию, синтезированную из тех что встретил в процессе работы. И хотел бы услышать мнение экспертов, насколько она рациональна, адекватна и полезна. А главное не слышали ли вы её где-нибудь раньше?
Проведя анализ существующих механизмов аутентификации я выделил 3 основных характеристики, которыми обладает каждый из них:
Читать полностью »
Распознавание образов с OpenCV: Контуры против Haartraining
2013-03-29 в 10:36, admin, рубрики: computer vision, opencv, Алгоритмы, классификация, Песочница, распознавание изображений, распознавание образов, распознавание объектов, метки: computer vision, opencv, каскад., классификация, распознавание изображений, распознавание образов, распознавание объектов Привет! Передо мной встала задача реализовать распознавание дорожных знаков с видео потока. Так как с задачами подобного рода я раньше не сталкивался, то процесс реализации само собой предполагает предварительное долгое «курение» форумов и безжалостные издевательства над чужими примерами. Поэтому решил собрать всё прочитанное в одном месте для будущих поколений, а так же, в ходе повествования, задать Хабру несколько вопросов.
Читать полностью »
Ошибки PHP: классификация, примеры, обработка
2012-12-05 в 11:58, admin, рубрики: php, классификация, ошибки, метки: PHP, классификация, ошибкиВ статье представлена очередная попытка разобраться с ошибками, которые могут встретиться на вашем пути php-разработчика, их возможная классификация, примеры их возникновения, влияние ошибок на ответ клиенту, а также инструкции по написанию своего обработчика ошибок.Читать полностью »
Информационная безопасность / Глава Group IB: русские хакеры считаются самыми меркантильными в мире
2012-02-14 в 18:38, admin, рубрики: group ib, интервью, классификация, хакеры, метки: group ib, интервью, классификация, хакеры Топики-ссылки некоторое время назад канули в лету, поэтому этот придётся оформить кратко, поскольку он будет представлять из себя только ссылку на материал другого ресурса с краткой аннотацией и цитатами, чтобы можно было понять о чём речь и стоит ли туда переходить.
Материал представляет из себя интервью с Ильёй Сачковым — генеральным директором компании Group IB, которая специализируется на расследовании компьютерных преступлений. Интервью изначально спорное, поскольку содержит оценки такой специфической социальной группы как хакеры по «национальному» признаку, но тем интереснее познакомиться с мнением «со стороны».
Читать полностью »