Рубрика «big data» - 120

Корпорация IBM открыла доступ к Watson Analytics для всех

2014-12-16 в 11:35, admin, рубрики: big data, IBM, Блог компании IBM, высокая производительность, Облачные вычисления

Корпорация IBM открыла доступ к Watson Analytics для всех - 1

Сервис Watson Analytics становится открытым практически для всех, пока в бета-версии. Ранее о намерении открыть доступ к Watson Analytics корпорация IBM уже заявляла, и сейчас обещание выполнено. Watson Analytics является частью проекта создания подразделения компании на основе IBM Watson. Общая стоимость проекта составляет более миллиарда долларов США.

Для тестирования возможностей сервиса в бета-режиме нужно было подать заявку, с сентября таких заявок было подано более 22 тысяч. Сразу после запуска открытого доступа появилась и группа Watson Analytics Community, участники которой занимаются обсуждением возможностей сервиса, а также популяризацией возможностей IBM Watson.

Читать полностью »

Обзор наиболее интересных материалов по анализу данных и машинному обучению №26 (8 — 14 декабря 2014)

2014-12-14 в 13:45, admin, рубрики: big data, data mining, data science, data science digest, machine learning

Обзор наиболее интересных материалов по анализу данных и машинному обучению №26 (8 — 14 декабря 2014) - 1
Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения.
Читать полностью »

Сравнение скорости построения линейных моделей в R и Eviews

2014-12-11 в 16:08, admin, рубрики: big data, eviews

Если Вам необходимо оценить эконометрическую модель с небольшим количеством наблюдений, то софт, в котором это можно сделать определяется исключительно Вашими предпочтениями и финансовыми возможностями. Но если количество наблюдений большое? Регрессия не всегда оценивается в одно мгновение. В этом посте я сравниваю время оценки линейной регрессии в R и Eviews в зависимости от количества наблюдений.
Читать полностью »

Яндекс открывает новое направление своей деятельности — Yandex Data Factory

2014-12-09 в 13:23, admin, рубрики: big data, data mining, Блог компании Яндекс, Большие данные, Исследования и прогнозы в IT, матрикснет, машинное обучение, Облачные вычисления, яндекс

Только что в Париже на конференции La Web Яндекс объявил об открытии нового важного направления своей деятельности — по коммерческой обработке больших данных — Yandex Data Factory.

Мы верим, что обработка больших данных — это часть нового витка технической революции, который сделает всё человечество ещё более эффективным и приведёт нас к будущему, которое мы сейчас ещё даже не можем до конца представить. И в нём работа с большими объёмами данных будет не менее важным и распространённым, чем выработка электричества или железные дороги сегодня.

Перед публичным запуском Yandex Data Factory мы провели несколько пилотных проектов с компаниями-партнёрами. Для компании, обслуживающей линии электропередач, в Yandex Data Factory создали систему, которая анализирует сделанные беспилотниками снимки и автоматически выявляет угрозы: например, деревья, растущие слишком близко к проводам. А для автодорожного агентства проанализировали данные о загруженности дорог, качестве покрытия, средней скорости движения транспорта и аварийности. Это позволило в режиме реального времени составлять прогноз заторов на дорогах на ближайший час и выявлять участки с высокой вероятностью ДТП.
Читать полностью »

Yandex Data Factory

Yandex Data Factory - 1

Hadoop для сетевых инженеров

2014-12-09 в 12:06, admin, рубрики: big data, Cisco, cpa, Hadoop, nexus 2000, nexus 2232pp, servers, UCS, ucs director express, Блог компании Cisco

Apache Hadoop — это набор утилит для построения суперкомпьютера, способного решать задачи, слишком большие для одного сервера. Множество серверов образуют Hadoop-кластер. Каждая машина в кластере носит название узла, или ноды. Если необходимо увеличить производительность системы, то в кластер просто добавляется больше серверов. Ethernet выполняет функции «системной шины» суперкомпьютера. В данной статье будут рассмотрены аспекты дизайна сетевой инфраструктуры, а также архитектура, которую Cisco предлагает использовать для таких систем.
Читать полностью »

Highload ++ 2014 глазами докладчика, который очень любит Processing Large-Scale Graph Data разными нехорошими способами

2014-12-08 в 7:49, admin, рубрики: big data, nosql, open source, OpenStreetMap, Учебный процесс в IT

Всем привет!

Вы наверняка слышали о конференции разработчиков высоконагруженных систем Highload++ или сами участвовали или выступали или даже перестали ездить на нее, проклиная ее в соц.сетях.

К конференции Highload у меня весьма трепетное отношение, ибо моя первая поездка на нее в 2012 стабилизировала хаотичные на тот момент знания в некую упорядоченную цепь, структуру и предоставила наиболее широкий обзор текущего рынка Highload технологий в России и за ее пределами.

В 2013 году я с удовольствием смотрел онлайн-трансляцию вечером из офиса Тамтэка, обсуждая с коллегами преимущества Rabbit MQ, дубльгисовские попытки запихать все в Neo4j, а также доклад нашего коллеги Дениса Нелюбина о сравнении производительности NoSQL баз данных (Aerospike, Couchbase, Mongo, Cassandra) на нашем тестовом фреймворке, в разработке которого я сам принимал участие годом ранее.

В 2014, 14 марта, в свой день рождения, я отправил заявку с описанием доклада на Highload и стал ждать. После полугода мне пришло подтверждение и я отправился в путь, надеясь не только познакомиться с коллегами, работающими в смежных областях, но и поднять свое Big Data сознание на новой уровень.

Читать полностью »

Обзор наиболее интересных материалов по анализу данных и машинному обучению №25 (1 — 7 декабря 2014)

2014-12-07 в 13:38, admin, рубрики: big data, data mining, data science, data science digest, machine learning

Обзор наиболее интересных материалов по анализу данных и машинному обучению №25 (1 — 7 декабря 2014) - 1
Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения.
Читать полностью »

Немцы создали библиотеку пьяных аудиозаписей

2014-12-05 в 12:30, admin, рубрики: big data, data mining, автомобили, лингвистический анализ, машинное обучение, пьянству бой

Эпиграф:
— Пил?
— Не пил!
— Скажи Гибралтар.
— Пил.

Тема немного курьезная, но мне кажется, что именно таких в последнее время не хватает на Хабре. Особенно в пятницу.

Немцы создали библиотеку пьяных аудиозаписей - 1

Итак, немецкие ученые из двух университетов Мюнхена создали базу аудизаписей, где записа речь 162-х людей в состояние алкогольного опьянения. Данные собирались с 2007 года по 2009 и теперь на основании базы данных создается языковой корпус (статья о корпусах на Вики) Alcohol Language Corpus (ALC).Читать полностью »

Как узнать больше о ваших пользователях? Применение Data Mining в Рейтинге Mail.Ru

2014-12-03 в 13:22, admin, рубрики: big data, data mining, machine learning, mail.ru, Блог компании Mail.Ru Group, Рейтинг Mail.ru

Любой интернет-проект можно сделать лучше. Реализовать новые фичи, добавить серверов, переделать интерфейс или выпустить новую версию API. Вашим пользователям это понравится. Или нет? И вообще, что это за люди? Молодые или в возрасте? Обеспеченные или скорее наоборот? Из Москвы? Питера? Сан-Франциско, штат Калифорния? И почему, в конце концов, те сто теплых пледов, что вы закупили еще в мае, пылятся на складе, а футболки с октокотами расходятся, как горячие пирожки? Получить ответы поможет проект Рейтинг Mail.Ru. Эта статья о том, как мы применяем data mining, чтобы ответить на самые сложные вопросы
Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Рубрика «big data» - 120

Корпорация IBM открыла доступ к Watson Analytics для всех

Обзор наиболее интересных материалов по анализу данных и машинному обучению №26 (8 — 14 декабря 2014)

Сравнение скорости построения линейных моделей в R и Eviews

Яндекс открывает новое направление своей деятельности — Yandex Data Factory

Yandex Data Factory

Hadoop для сетевых инженеров

Highload ++ 2014 глазами докладчика, который очень любит Processing Large-Scale Graph Data разными нехорошими способами

Обзор наиболее интересных материалов по анализу данных и машинному обучению №25 (1 — 7 декабря 2014)

Немцы создали библиотеку пьяных аудиозаписей

Как узнать больше о ваших пользователях? Применение Data Mining в Рейтинге Mail.Ru

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «big data» - 120

Новости

Актуальные темы

Архив