Рубрика «big data» - 112

В предыдущих сериях: Big Data — это не просто много данных. Правильные Big Data организуют позитивную обратную связь. В 3-ей серии: «Кнопка Обамы» как воплощение задач класса rtBD&A глазами аналитика Big Data.

По одной из современных легенд упоминание термина «Кнопка Обамы» появилось во времена президенства Д. Медведева, когда последний поехал в США. На встрече двух президентов-юристов и двух больших поклонников продукции Apple Барак Обама якобы похвалился интересным решением: iPad, на который установлена специализированная программа-телесуфлер с функцией отображения реакции телезрителей и слушателей.
Читать полностью »

Вы когда чаще злы — с утра, днем, или под вечер? Можно ли было уменьшить потери Сколково на досрочное сокращение инвестиций в «неудачные» 50-70 стартапы? Куда перехать жить? Вы можете задаться и другими вероятностно-неопределенными вопросами и задачами — у каждого из нас есть таких мильон. Часто технологии Big Data позволяют … нет, не решить, а правильно подойти к проблематике в целом, посмотреть с высоты Демиурга, поставить правильные вопросы и выстроить более оптимальные пути практического решения.

В комментариях к 1-й серии ServPonomarev задал интересный вопрос про кейсы получения новых мета-знаний из Big Data. Предлагаем даже пойти немного дальше: новые технологии могут позволить не только получить новые знания, но и, по-демиурговски, повлиять новыми знаниями на окружение.
Читать полностью »

Майкл Стоунбрейкер получил премию Тьюринга 2014 - 1
Майкл Стоунбрейкер

Профессор Майкл Стоунбрейкер (Michael Stonebraker) с кафедры компьютерных наук и искусственного интеллекта Массачусетского технологического института, известный по своим революционным разработкам в области СУБД и как основатель нескольких компаний в этой области, назван лауреатом премии Тьюринга 2014 года, которая считается аналогом Нобелевской премии в сфере информатики.

В частности, Стоунбрейкер разработал две СУБД Ingres и Postgre, которые оказали значительное влияние на развитие отрасли, в частности, повлияв на разработку многих других проектов, включая IBM Informix и EMC Greenplum.

Впервые спонсируемый компанией Google призовой фонд в размере $1 млн будет выплачен в полном размере.
Читать полностью »

Big Data глазами разных индустрий — это очередная мечта о Граале, который решит, спасет и защитит! В жизни всё точностью до наоборот: Big Data — это совершенно новые задачи, свертывания застойных проектов и увольнения неперестроившихся специалистов. Предлагаем цикл статей по практике реального применения неструктурированных Big Data в разных индустриях, становлении новых специальностей, которым еще только придумываются названия — аналитик и социолог Big Data, HiLoad-лингвист, журналист-трендист (от слова трЕнд, а не трЫндеть :-) ), — и, надеемся, плодотворных обсуждений куда должна привести новая большая дорога.
Читать полностью »

Снифаем выходную ноду Tor’а и анализируем получившийся контент - 1

Концепция «сеть поверх сети» появилась далеко не вчера. Еще в середине прошлого десятилетия «Хакер» писал о луковой и чесночной маршрутизации в лице Tor и I2P и даже публиковал обзоры соответствующего софта в рубрике «Шароwarez», но настоящий интерес к ним в обществе появился на волне известных инфоповодов и громких разоблачений последнего времени. Что же представляют собой даркнеты? Кто там живет? Чем они интересуются, чем дышат, что покупают и что продают? Попробуем разобраться с этим по-хакерски: с помощью снифера и прямого погружения.
Читать полностью »

Как Big Data и «Интернет вещей» влияют на дата-центры. Энергопотребление. Часть 1 - 1

Big Data, «большие данные» продолжают расширяться и увеличиваться в объеме. По данным Science Daily, в 2013 году около 90% всех данных в мире были созданы в предыдущие два года. Информации становится все больше, тем более, что и количество интернет-пользователей продолжает увеличиваться взрывными темпами. В настоящий момент в мире насчитывается около 2,5 миллиарда интернет-пользователей.

Кроме того, увеличивается и количество устройств, гаджетов, подключенных к Сети. Все это устройства, включая фитнес-трекеры, камеры телефонов и даже умные кофеварки, генерируют данные, которые требуется где-то хранить. С увеличением количества данных в мире увеличивается и потребность в увеличении вычислительных мощностей и свободном объеме для хранения информации.
Читать полностью »

Нейропластичность в искусственных нейронных сетях - 1 Привет, давно не виделись. В этом посте мне хотелось бы рассказать о таком относительно новом понятии в машинном обучении, как transfer learning. Так как я не нашел какого-либо устоявшегося перевода этого термина, то и в названии поста фигурирует хоть и другой, но близкий по смыслу термин, который как бы является биологической предпосылкой к формализации теории передачи знаний от одной модели к другой. Итак, план такой: для начала рассмотрим биологические предпосылки; после коснемся отличия transfer learning от очень похожей идеи предобучения глубокой нейронной сети; а в конце обсудим реальную задачу семантического хеширования изображений. Для этого мы не будем скромничать и возьмем глубокую (19 слоев) сверточную нейросеть победителей конкурса imagenet 2014 года в разделе «локализация и классификация» (Visual Geometry Group, University of Oxford), сделаем ей небольшую трепанацию, извлечем часть слоев и используем их в своих целях. Поехали.
Читать полностью »

Техносфере — 1 год - 1

Многие из вас, возможно, уже слышали или читали в нашем блоге о Технопарке, совместном образовательном проекте Mail.Ru Group и МГТУ им. Н. Э. Баумана. Однако постойте, есть еще и Техносфера. Что это, кто это и почему эти два проекта так похожи, и чем они различаются, я расскажу в этом посте.

В феврале исполнился ровно год с момента запуска Техносферы. Это совместный образовательный проект Mail.Ru Group и факультета вычислительной математики и кибернетики МГУ имени М. В. Ломоносова. Обучением студентов занимаются исключительно сотрудники Mail.Ru Group. Их цель — подготовить квалифицированных специалистов в области анализа больших данных (Big Data). Первые десять выпускников совсем недавно получили дипломы из рук Дмитрия Гришина, CEO Mail.Ru Group, и уже приступили к работе.
Читать полностью »

image
Компания Cornerstone OnDemand, которая занимается разработкой и продажей программного обеспечения для онлайн-тестов при приёме на работу, показала результаты своих исследований из мира Big Data. Выяснилось, что те претенденты на работу, которые при прохождении теста используют Chrome или Firefox, лучше выполняют свою работу и в среднем на 15% дольше остаются на своих рабочих местах. Речь идёт о специалистах в области телекоммуникаций, продаж и гостиничном бизнесе.
Читать полностью »

Предлагаю читателям «Хабрахабра» перевод поста «Deep Learning, NLP, and Representations» крутого Кристофера Олаха. Иллюстрации оттуда же.

В последние годы методы, использующие глубокое обучение нейросетей (deep neural networks), заняли ведущее положение в распознавании образов. Благодаря им планка для качества методов компьютерного зрения значительно поднялась. В ту же сторону движется и распознавание речи.

Результаты результатами, но почему они так круто решают задачи?

В посте освещено несколько впечатляющих результатов применения глубоких нейронных сетей в обработке естественного языка (Natural Language Processing; NLP). Таким образом, я надеюсь доходчиво изложить один из ответов на вопрос, почему глубокие нейросети работают.
Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js