Рубрика «big data» - 79

ВВС США используют нейроморфный чип IBM для обнаружения танков и наземных систем ПВО

2017-03-12 в 20:16, admin, рубрики: big data, truenorth, Алгоритмы, Блог компании IBM, Железо, нейроморфный чип, США, цифровые технологии

ВВС США используют нейроморфный чип IBM для обнаружения танков и наземных систем ПВО - 1

Современные технологии очень интересуют военных. Не секрет, что многие технологии сначала создавались для военных нужд, а потом уже появлялись и в обычной жизни мирных граждан. Сейчас военно-воздушные силы США тестируют в полевых условиях нейроморфный чип, созданный силами специалистов IBM. Об этом чипе уже публиковалась информация в блоге нашей компании. Он может использоваться в самых разных целях, и одна из них — обнаружение и идентификация определенных объектов.

ВВС США, а именно Air Force Research Lab (AFRL), использует возможности процессора для идентификации военных и гражданских транспортных средств при радиолокации с воздуха. Военные утверждают, что чип работает не хуже, чем мощный военный компьютер. Но энергии при этом потребляется в двадцать раз меньше.
Читать полностью »

Как мы отранжировали девять миллионов разработчиков на Github

2017-03-08 в 8:06, admin, рубрики: big data, javascript, Программирование, стартапы

beta.gitlance.net/top/javascript

Источник изображения: beta.gitlance.net/top/javascript

Оценивая разработчика ПО в качестве потенциального партнера, работника или подрядчика, многим доводилось в какой-то момент потратить время на копание в его репозиториях на Github, пытаясь понять, что за проекты тот пишет и какого качества у него код. Это занятие малоэффективно, к тому же еще сопряжено с определенными трудностями как оценивание степени вклада разработчика в тот или иной репозиторий, качества его кода; можно гадать о том, действительно ли это его код, и так далее.

Разработчикам же, со своей стороны, трудно преподнести свой талант в доступной и наглядной форме. Многие в итоге создают собственные веб-сайты с перечислением интересных проектов, в которых участвовали или сами являются их авторами, что, конечно, дает результат, но тоже с переменным успехом.

Мы же верим, что есть способ получше, и именно поэтому создали GitLance. По сути своей, коммиты в Git подобно бухгалтерской книге надежно фиксируют вклад каждого из участников, а на Github находится огромное множество публичных репозиториев Git вместе с их разработчиками, а также сравнимое количество их взаимных оценок в виде звёздочек на репозиториях и форков, идущих от них. Так почему бы не воспользоваться этим для генерации кодового графа?

Читать полностью »

Power BI Embedded, IoT и машинное обучение для обработки термограмм мозга

2017-03-06 в 7:38, admin, рубрики: big data, IoT, microsoft, Microsoft Technical Case Studies, Power BI, Блог компании Microsoft, Интернет вещей, машинное обучение, Разработка для интернета вещей

Каждую неделю в Microsoft появляются кейсы, посвящённые разработке решений для компаний, университетов и даже государств. Мы решили поделиться с вами самыми интересными из них и начать серию статей «Microsoft Technical Case Studies». В первом материале вы узнаете про IoT-решение для обработки изображений «теплового тоннеля мозга» (Brain Temperature Tunnel) согласно методике, основанной на исследованиях доктора Марка Абреу (Marc Abreu) из Йельского университета.

Power BI Embedded, IoT и машинное обучение для обработки термограмм мозга - 1
Читать полностью »

Vertica+Anchor Modeling = запусти рост своей грибницы

2017-03-03 в 11:02, admin, рубрики: big data, Vertica, Блог компании Avito, хранилище данных

Какое-то время назад я написал статью на Хабре. В ней же пообещал продолжение через пару недель. Но, как известно, обещанного три года ждут — и с тех пор действительно прошло три года. Если вы не запомнили со времён той статьи, то напомню — я работаю в Avito, строю хранилище на основе Vertica.
Из того, что поменялось — теперь я могу не просто написать статью, а сделать это в блоге компании. И, надеюсь, не один раз. Самопиар окончен, теперь к делу.

Читать полностью »

Центробанк через «Яндекс» снова отловит «чёрные» микрокредиты

2017-03-02 в 20:49, admin, рубрики: big data, GR, Yandex Data Factory, банки, Госвеб, госзакупки, поиск, соцсети, Текучка, Центробанк, яндекс, метки: big data, GR, Yandex Data Factory, банки, Госвеб, госзакупки, поиск, соцсети, Текучка, Центробанк, яндекс

Начальник Главного управления рынка микрофинансирования и методологии финансовой доступности «Банка России» (Центробанка) Илья Кочетков рассказал «Российской газете» о продолжении охоты на нелегальных кредиторов.

Читать полностью »

Superjob Data Science Meetup. Прямая трансляция

2017-03-02 в 15:58, admin, рубрики: big data, data analysis, data mining, data science, data science digest, data scientist, data structures, development, meet-up, meet-ups, meetup, SuperJob, superjob.ru, Блог компании Superjob.ru, встреча разработчиков, мероприятие, Мероприятия, Москва, Программирование, прямая трансляция, разработка, Сбербанк-Технологии, события, события IT профессионалов, трансляция

Специально для тех, кто не успел зарегистрироваться на Superjob Data Science Meetup, мы организуем прямую трансляцию события на Youtube или Facebook.

Начало в 19:00 по московскому времени.

Читать полностью »

Тонкости R. Как минута час экономит

2017-03-01 в 6:18, admin, рубрики: big data, data mining, data science, R

Довольно часто enterprise задачи по обработке данных затрагивают данные, сопровождаемые временной меткой. В R такие метки, обычно хранятся как класс POSIXct. Выбор методов работы с таким типом данных по принципу аналогии может привести к большому разочарованию и убеждению о крайней медлительности R. Хотя если взглянуть на эту чуть более пристально, то оказывается, что дело не совсем в R, а в руках и голове.

Ниже затрону пару кейсов, которые встретились в этом месяце и возможные варианты их решения. В ходе решения появляются весьма интересные вопросы. Заодно упомяну инструменты, которые оказываются крайне полезными для решения подобных задачек. Практика показала, что об их существовании знают немногие.

Читать полностью »

Будут ли data scientist’ы в ближайшее время заменены автоматизированными алгоритмами и искусственным интеллектом?

2017-02-22 в 13:24, admin, рубрики: big data, data mining, data science, data scientist, Блог компании New Professions Lab, глубокое обучение, машинное обучение

В современном машинном обучении и науке о данных можно выделить несколько трендов. Прежде всего, это глубокое обучение: распознавание изображений, аудио и видео, обработка текстов на естественных языках. Еще одним трендом становится обучение с подкреплением — reinforcement learning, позволяющее алгоритмам успешно играть в компьютерные и настольные игры, и дающее возможность постоянно улучшать построенные модели на основе отклика внешней среды.

Есть и еще один тренд, менее заметный, так как его результаты для внешних наблюдателей выглядят не так впечатляюще, но не менее важный — автоматизация машинного обучения. В связи с его стремительным развитием вновь актуальным становится вопрос о том, не будут ли data scientist’ы в конце концов автоматизированы и вытеснены искусственным интеллектом.
Читать полностью »

Мифы о CAP теореме

2017-02-21 в 6:37, admin, рубрики: big data, CAP теорема, nosql, YT, Алгоритмы, Анализ и проектирование систем, доступность, консистентность, Промышленное программирование, распределенные системы

Введение

cap

Давно хотел написать про мифы о CAP теореме, но как-то все не доходили руки. Однако, почитав очередной опус, схватился за голову и решил разложить все по полочкам, чтобы в мозгах возникла стройная картина.

Событие, когда какая-то статья вызывает бурю эмоций, — крайне редкое. Первый раз такое возникло, когда я прочитал про chained replication. Меня пытались убедить, что это мощный подход и что это лучшее, что могло произойти с консистентной репликацией. Я сейчас не буду приводить доводы, почему это плохо работает, а просто приведу говорящую цитату из статьи Chain Replication metadata management:

Split brain management is a thorny problem. The method presented here is one based on pragmatics. If it doesn’t work, there isn’t a serious worry, because Machi’s first serious use case all require only AP Mode. If we end up falling back to “use Riak Ensemble” or “use ZooKeeper”, then perhaps that’s fine enough.

В моем вольном пересказе это означает примерно следующее: "У нас тут есть некий алгоритм. Мы не знаем, будет ли он работать правильно или нет. Да нам это и не важно". Хотя бы честно, сэкономило кучу времени, спасибо авторам.

И тут, значит, попадается на глаза статья: Spanner, TrueTime & The CAP Theorem. Её мы разберем по полочкам ближе к концу, вооружившись понятиями и знаниями. А перед этим разберем самые распространенные мифы, связанные с CAP теоремой.

Читать полностью »

Книга «Основы Data Science и Big Data. Python и наука о данных»

2017-02-20 в 16:20, admin, рубрики: big data, python, Блог компании Издательский дом «Питер», книги, Профессиональная литература

Data Science — это совокупность понятий и методов, позволяющих придать смысл и понятный вид огромным объемам данных.

Каждая из глав этой книги посвящена одному из самых интересных аспектов анализа и обработки данных. Вы начнете с теоретических основ, затем перейдете к алгоритмам машинного обучения, работе с огромными массивами данных, NoSQL, потоковым данным, глубокому анализу текстов и визуализации информации. В многочисленных практических примерах использованы сценарии Python.

Обработка и анализ данных — одна из самых горячих областей IT, где постоянно требуются разработчики, которым по плечу проекты любого уровня, от социальных сетей до обучаемых систем. Надеемся, книга станет отправной точкой для вашего путешествия в увлекательный мир Data Science.
Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Рубрика «big data» - 79

ВВС США используют нейроморфный чип IBM для обнаружения танков и наземных систем ПВО

Как мы отранжировали девять миллионов разработчиков на Github

Power BI Embedded, IoT и машинное обучение для обработки термограмм мозга

Vertica+Anchor Modeling = запусти рост своей грибницы

Центробанк через «Яндекс» снова отловит «чёрные» микрокредиты

Superjob Data Science Meetup. Прямая трансляция

Тонкости R. Как минута час экономит

Будут ли data scientist’ы в ближайшее время заменены автоматизированными алгоритмами и искусственным интеллектом?

Мифы о CAP теореме

Введение

Книга «Основы Data Science и Big Data. Python и наука о данных»

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «big data» - 79

Введение

Новости

Актуальные темы

Архив