Рубрика «кластеризация» - 4

Как мы кластеризуем подарки в ОК

2014-10-16 в 13:25, admin, рубрики: data mining, Hadoop, mcl, Блог компании Mail.Ru Group, Блог компании Одноклассники, кластеризация, одноклассники

Всем привет! Меня зовут Артур, я аналитик в отделе анализа данных департамента рекламных технологий Mail.Ru Group. И я попробую рассказать о том, как мы используем кластеризацию в своей работе.

Чего в этой статье не будет: я не буду рассказывать об алгоритмах кластеризации, об анализе качества или сравнении библиотек. Что будет в этой статье: я покажу на примере конкретной задачи что такое кластеризация (с картинками), как ее делать если данных действительно много (ДЕЙСТВИТЕЛЬНО много) и что получается в результате.

Читать полностью »

Настройка Cyclos кластера на базе Jelastic Platform-as-Infrastructure

2014-08-20 в 8:57, admin, рубрики: высокая доступность, кластеризация, репликация базы данных

Cyclos — банковская он-лайн система с дополнительными модулями для электронной коммерции, средств связи и многих других функциональностей в данной сфере. С помощью динамической структуры Cyclos можно легко создать специализированную платежную систему простым изменением настроек.

Недавно Cyclos выпустили новую четвертую версию своего продукта, а Jelastic предоставил возможность установить её в один клик. Это можно сделать через сайт Cyclos (для этого требуется регистрация) или используя JPS виджет на нашей странице Marketplace.
jelastic and cyclos Читать полностью »

Вероятностные модели: LDA, часть 2

2014-07-16 в 15:52, admin, рубрики: data mining, байесовские сети, Блог компании Surfingbird, искусственный интеллект, классификация, кластеризация, математика, математическое моделирование, теория вероятностей

Продолжаем разговор. В прошлый раз мы сделали первый шаг на переходе от наивного байесовского классификатора к LDA: убрали из наивного байеса необходимость в разметке тренировочного набора, сделав из него модель кластеризации, которую можно обучать ЕМ-алгоритмом. Сегодня у меня уже не осталось отговорок – придётся рассказывать про саму модель LDA и показывать, как она работает. Когда-то мы уже говорили об LDA в этом блоге, но тогда рассказ был совсем короткий и без весьма существенных подробностей. Надеюсь, что в этот раз удастся рассказать больше и понятнее.
Вероятностные модели: LDA, часть 2
Читать полностью »

Вероятностные модели: от наивного Байеса к LDA, часть 1

2014-07-02 в 10:49, admin, рубрики: data mining, байесовские сети, Блог компании Surfingbird, искусственный интеллект, классификация, кластеризация, математика, математическое моделирование, теория вероятностей

Продолжаем разговор. Прошлая статья была переходной от предыдущего цикла о графических моделях вообще (часть 1, часть 2, часть 3, часть 4) к новому мини-циклу о тематическом моделировании: мы поговорили о сэмплировании как методе вывода в графических моделях. А теперь мы начинаем путь к модели латентного размещения Дирихле (latent Dirichlet allocation) и к тому, как все эти чудесные алгоритмы сэмплирования применяются на практике. Сегодня – часть первая, в которой мы поймём, куда есть смысл обобщать наивный байесовский классификатор, и заодно немного поговорим о кластеризации.

Вероятностные модели: от наивного Байеса к LDA, часть 1
Читать полностью »

Алгоритм нечёткой кластеризации fuzzy c-means на PHP

2014-01-08 в 19:44, admin, рубрики: php, Алгоритмы, кластеризация, метки: PHP, Алгоритмы, кластеризация

Доброго времени суток.

Пост и код приведённый ниже, предназначен не столько для использования алгоритма в рабочих целях, сколько для того, чтобы понять, как алгоритм fuzzy c-means работает и возможно, дать толчок к реализации этого алгоритма на других языках либо для усовершенствования приведённого кода и его дальнейшего использования в рабочих целях.

Алгоритм нечёткой кластеризации fuzzy c means на PHP

Читать полностью »

Алгоритм кластеризации данных FTCA

2013-12-21 в 16:27, admin, рубрики: Алгоритмы, кластеризация, метки: Алгоритмы, кластеризация

Предисловие

Гуляя по англоязычным просторам интернета в поисках решения одной из наболевших тем на работе, наткнулся на очень интересный алгоритм под названием «Fast Threshold Clustering Algorithm». Данный алгоритм кластеризации, что примечательно, появился сравнительно недавно, а именно в ноябре этого года и автором является Дэвид Варади. Ссылка на первоисточник будет доступна в конце статьи.

Для начала, что такое кластеризатор?

Читать полностью »

Отказоустойчивый кластер Hyper-V 2012

2013-11-12 в 10:21, admin, рубрики: failover cluster, hyper-v, windows, виртуализация, кластеризация, метки: failover cluster, hyper-v, виртуализация, кластеризация

Сразу отмечу, что многие, кто сталкивался с виртуализацией от Microsoft, ничего нового для себя не найдут — это небольшой гайд по созданию кластера на базе Hyper-V 2012 с некоторыми тонкостями, касающихся конкретной конфигурации.
Итак, что мы имеем:

Два сервера с внешним SAS портом и 4-х портовой сетевой картой
Дисковое хранилище HP P2000 G3 SAS
Коммутатор, а лучше два в стеке, с поддержкой LACP, в моем случае — это стек из двух Cisco 2960S

По заверениям MS, желательно иметь одинаковые контроллеры SAS, с одинаковыми драйверами и прошивками, на всех узлах кластера.

Так же нам потребуется:

Домен AD
Компьютер или ноутбук в домене с установленной ОС Windows 8 или 8.1, для управления
Средства удаленного администрирования сервера — RSAT для windows 8 или 8.1

Важно отметить, что для управляющего ПК, windows 7 не подойдет, т.к. некоторый функционал RSAT для win 7 не работает с серверами семейства 2012.
Читать полностью »

Как создать кластер в JBoss AS 7.1 в автономном (standalone) режиме?

2013-08-09 в 12:44, admin, рубрики: java, javaee, jboss, высокая производительность, кластеризация

Статья переведена и опубликована здесь с целью дополнить ее рецептом от себя, добытом на основе личного опыта. Есть надежда, что кто-то сэкономит полдня-день гугления и массу проб и ошибок, с которыми пришлось столкнуться мне. Далее следует вольный перевод и дополнение лично от меня.

JBoss AS 7 кардинально отличается от предыдущих версий JBoss, следовательно, если вы хотите создать кластер в JBoss AS 7, вам следует знать несколько вещей, чтобы не столкнуться с проблемами.
Читать полностью »

Решение задачи кластеризации методом градиентного спуска

2013-08-02 в 12:04, admin, рубрики: data mining, Алгоритмы, искусственный интеллект, кластеризация, метки: кластеризация

Решение задачи кластеризации методом градиентного спуска Привет. В этой статье будет рассмотрен способ кластеризации данных, используя метод градиентного спуска. Честно говоря данный способ носит больше академический характер, нежели практический. Реализация этого метода мне понадобилась в демонстрационных целях для курса по машинному обучению, что бы показать как одинаковые задачи можно решить различными способами. Хотя конечно если вы планируете осуществить кластеризацию данных, используя дифференцируемую метрику, для которой вычислительно труднее найти центроид, нежели подсчитать градиент на некотором наборе данных, то этот метод может быть полезным. Итак если вам интересно как можно решить задачу k-means кластеризации с обобщенной метрикой используя метод градиентного спуска, прошу под кат. Код на языке R.

Читать полностью »

Как сэкономить деньги в Amazon Web Services — выбор эффективной архитектуры

2013-03-26 в 7:22, admin, рубрики: 1С-Битрикс, Блог компании 1С-Битрикс, Веб-разработка, кластеризация, системное администрирование, метки: 1С-Битрикс, amazon, кластеризация

Всем привет!

Сегодня поговорим на тему как «профессионально сэкономить» деньги при использовании облачных сервисов Amazon Web Services при размещении веб-решений, адаптированных для России. Мы активно используем сервисы данного облачного провайдера для проектов компании почти 2 года и постоянно занимаемся оптимизацией расходов. Довольно странно, что важная тема оптимизации расходов на Amazon Web Services, очищенная от маркетингового булшита, как-то не особо представлена в сети. Постараюсь предметно поделиться опытом и обозначить явные выгоды и ошибки, которые следует учесть при проектировании веб-систем.

Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Рубрика «кластеризация» - 4

Как мы кластеризуем подарки в ОК

Настройка Cyclos кластера на базе Jelastic Platform-as-Infrastructure

Вероятностные модели: LDA, часть 2

Вероятностные модели: от наивного Байеса к LDA, часть 1

Алгоритм нечёткой кластеризации fuzzy c-means на PHP

Алгоритм кластеризации данных FTCA

Предисловие

Для начала, что такое кластеризатор?

Отказоустойчивый кластер Hyper-V 2012

Как создать кластер в JBoss AS 7.1 в автономном (standalone) режиме?

Решение задачи кластеризации методом градиентного спуска

Как сэкономить деньги в Amazon Web Services — выбор эффективной архитектуры

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «кластеризация» - 4

Предисловие

Для начала, что такое кластеризатор?

Новости

Актуальные темы

Архив