Коронавирус окончательно захватил весь мир — и выражается это не в том, что им успел переболеть каждый житель планеты. На данный момент эта тема является главной и единственной — как в мировых, так и в российских новостях. В этой статье мы постараемся максимально абстрагироваться от политики и рассуждений о том, запустили ли вирус китайские военные, или же Дональд Трамп. Вместо этого мы посмотрим на проблему с математической точки зрения — а именно, выясним, как можно описать эпидемию одним уравнением, а в конце статьи предскажем итоговое число зараженных COVID-19 — в том числе в России.
Рубрика «машинное обучение» - 48
«Не будем порождать теории заговора». Разговор про ML-конференции с людьми из науки и IT-компаний
2020-03-21 в 9:47, admin, рубрики: Блог компании Яндекс, идеи и реализация, Исследования и прогнозы в IT, исследователи, конференции, машинное обучение, научные публикации, постеры, ученыеСейчас почти никакие публичные мероприятия не проходят, но мы надеемся, что скоро ситуация изменится (и прикладываем к этому усилия). Мы ждём, что перенесённые события пройдут в другие даты, а будущие — не отменятся, поскольку в их отмене не будет необходимости. В том числе в 2020 году должны пройти десятки больших конференций по машинному обучению.
NeurIPS (бывшая NIPS) считается самой престижной из них. Каждый год NeurIPS собирает тысячи исследователей и инженеров, которые представляют свои научные результаты в разных областях ML: глубоком обучении, обучении с подкреплением, масштабируемой оптимизации, байесовских методах и другом.
По мотивам прошедшей несколько месяцев назад в Ванкувере NeurIPS мы провели дискуссию, куда пригласили экспертов из научного мира и мира IT. Каждый из них интересуется разными вещами в машинном обучении, опыт посещения NeurIPS тоже разный. Под катом — краткая выжимка тех частей дискуссии, которые относятся к причинам посетить конференцию.
Почему в машинном обучении используют «синтетические» данные
2020-03-21 в 8:44, admin, рубрики: 1сloud, Алгоритмы, Анализ и проектирование систем, Блог компании 1cloud.ru, машинное обучение, работа с данными, синтетические данныеОбсуждаем мнения ИТ-сообщества и экспертов индустрии. Также рассмотрим пару проектов, в рамках которых разрабатывают инструменты для генерации «искусственных» данных. Один из них представили выходцы из Агентства национальной безопасности США и Google.
Machine Learning по-казански, или как готовят специалистов машинного обучения в Татарстане
2020-03-20 в 19:33, admin, рубрики: machine learning, глубокое обучение, интервью, искусственный интеллект, Карьера в IT-индустрии, Компьютерное зрение, машинное обучение, нейросети, Учебный процесс в ITТатарстан давно проявляет амбициозность в развитии высоких технологий. Недавно 10-летие отметил казанский IT-парк — тот самый, где стартапы и небольшие компании рвутся на международный уровень. Город Иннополис тоже демонстрирует мощь вопреки скептическим прогнозам: если верить статистике, в 2019-м число жителей увеличилось на треть, а в технопарке открылись новые офисы мировых корпораций. Окей, а как здесь обстоят дела с общемировыми IT-трендами — машинным обучением и технологиями искусственного интеллекта? Читать полностью »
Рубрика «Читаем статьи за вас». Январь — Февраль 2020
2020-03-20 в 12:15, admin, рубрики: arxiv.org, data science, machine learning, ods, open data science, science, Алгоритмы, Блог компании Open Data Science, математика, машинное обучение, обработка изображений
Привет! Продолжаем публиковать рецензии на научные статьи от членов сообщества Open Data Science из канала #article_essense. Хотите получать их раньше всех — вступайте в сообщество!
Представлены обзоры 11 статей по Computer Vision, Natural Language Processing, Reinforcement learning и другим темам.
Как мы создавали галерею нейросетевого искусства и почему не даём копировать картины
2020-03-20 в 9:24, admin, рубрики: AI, Алгоритмы, Блог компании Яндекс, ИИ, искусственный интеллект, искусство, лаборатория машинного интеллекта, машинное обучение, нейросети, обработка изображений, яндексМы сегодня запустили виртуальную галерею, где все картины созданы нейронной сетью. Её особенность в том, что каждую картину в полном размере может забрать себе только один человек. Почти как в настоящей галерее.
В этом посте я расскажу о том, как родилась эта идея и как мы реализовали её с помощью двух нейросетей, одна из которых используется в поиске Яндекса.
Поговори со мной: что сегодня умеют голосовые боты
2020-03-19 в 13:54, admin, рубрики: Блог компании Mail.Ru Group, голосовой бот, искусственный интеллект, машинное обучение
18 лет назад в аниме-сериале «Призрак в доспехах: Синдром одиночки» показали совершенно фантастических роботов-операторов. Помимо очень продвинутых физических возможностей (вам бы с такими пальцами код набирать!), они прекрасно умели общаться с людьми голосом. Сегодня ботами уже никого не удивишь. Мы встречаемся с ними повсеместно, в различных сферах нашей жизни. Они используются в медицинских учреждениях, банках, в продажах, в обслуживании клиентов, в социальных сетях и т.д. И если к чат-ботам мы уже начинаем привыкать, то голосовые боты для многих ещё в новинку. Да и сами технологии ещё далеки от совершенства. Какая сейчас ситуация с голосовыми ботами?
Читать полностью »
Берём не только крутых математиков. Новый способ поступить в ШАД с опытом в IT
2020-03-19 в 13:49, admin, рубрики: Алгоритмы, Блог компании Яндекс, математика, машинное обучение, опыт программирования, ШАД, школа анализа данных, экзаменыДо 2020 года в Школу анализа данных могли попасть только те, кто очень глубоко и творчески владеет высшей математикой. Но этим качеством обладают не все способные люди, интересующиеся data science и инфраструктурой больших данных. Нередко разработчики, аналитики и молодые исследователи не помнят математику 1-2 курса вуза настолько хорошо, чтобы преодолеть наши вступительные экзамены. В этом году мы хотим дать таким людям возможность всё-таки попасть в ШАД. Мы организовали для них специальный трек поступления, о котором я расскажу ниже.
Но мало в ШАД попасть. Матанализ, линейная алгебра и теория вероятностей будут нужны дальше: без них не удастся разобраться с байесовскими методами, корректно оценить асимптотику сложности быстрой сортировки, написать хитрый метод многомерной оптимизации. Поэтому мы создаём принципиально новый адаптационный курс по математике. Все, кто поступят в ШАД по новым правилам, должны будут пройти этот курс.
Книга «Машинное обучение без лишних слов»
2020-03-18 в 10:01, admin, рубрики: Блог компании Издательский дом «Питер», книга, машинное обучение, Профессиональная литератураПривет, Хаброжители! Все, что вам действительно нужно знать о машинном обучении, может уместиться на паре сотен страниц.
Начнем с простой истины: машины не учатся. Типичное машинное обучение заключается в поиске математической формулы, которая при применении к набору входных данных (называемых обучающими данными) даст желаемые результаты.
Андрей Бурков постарался дать все необходимое, чтобы каждый мог стать отличным современным аналитиком или специалистом по машинному обучению. То, что удалось вместить в пару сотен страниц, в других книгах растянуто на тысячи. Типичные книги по машинному обучению консервативны и академичны, здесь же упор сделан на алгоритмах и методах, которые пригодятся в повседневной работе.
Читать полностью »
Как мы используем item2vec для рекомендаций похожих товаров
2020-03-18 в 7:51, admin, рубрики: data mining, item2vec, Алгоритмы, машинное обучение, обучение нейронных сетей, Программирование, рекомендательные системыПривет, меня зовут Вася Рубцов, я занимаюсь разработкой рекомендательных систем в Авито.
Основная цель площадки для размещения объявлений — помочь продавцам найти покупателей, а покупателям — товары, которые они ищут. В отличие от интернет-магазинов факт продажи происходит за пределами нашей платформы, и мы не можем это отследить. Поэтому ключевой метрикой у нас является «контакт» — это событие нажатия кнопки «показать телефон» на карточке товара, либо начало диалога в мессенджере с продавцом. Из этой метрики мы получаем «байеров» — количество уникальных пользователей в день, которые сделали по крайней мере один контакт.
Два основных продукта, которым занимается отдел рекомендаций в Авито, — это рекомендации для пользователя на главной странице или user2item и блок похожих объявлений на карточке товара или item2item. Треть всех просмотров объявлений и четверть всех контактов происходит с рекомендаций, поэтому рекомендательные движки играют важную роль в Авито.
В статье я расскажу, как мы улучшили наши item2item рекомендации за счёт item2vec и как это повлияло на user2item рекомендации.