Классификация текста — одна из наиболее распространенных задач в NLP и обучении с учителем, когда датасет содержит текстовые документы, а метки используются для тренировки текстового классификатора.
Читать полностью »
Рубрика «глубокое обучение» - 6
EXAM — State-of-the-art метод классификации текста
2019-01-12 в 14:27, admin, рубрики: nlp, nlp (natural language processing), Алгоритмы, глубокое обучение, классификация текста, классификация текстов, машинное обучениеОбучение с подкреплением на языке Python
2018-12-28 в 14:30, admin, рубрики: OpenAI Gym, python, RL, Алгоритмы, Блог компании Издательский дом «Питер», глубокое обучение, книги, машинное обучение, обучение с подкреплением, Профессиональная литератураПривет, коллеги!
В последней публикации уходящего года мы хотели упомянуть о Reinforcement Learning — теме, книгу на которую мы уже переводим.
Посудите сами: нашлась элементарная статья с Medium, в которой изложен контекст проблемы, описан простейший алгоритм с реализацией на Python. В статье есть несколько гифок. А мотивация, вознаграждение и выбор правильной стратегии на пути к успеху — это вещи, которые исключительно пригодятся в наступающем году каждому из нас.
Приятного чтения!
Читать полностью »
Верификация фотографий в ритейле с помощью Computer vision
2018-12-18 в 16:47, admin, рубрики: computer vision, Блог компании Tinkoff.ru, верификация, глубокое обучение, машинное обучение, обработка изображенийВступление
В рамках программы кредитования банк сотрудничает со многими розничными магазинами.
Одним из ключевых элементов заявки на кредит является фотография заемщика – агент магазина-партнера фотографирует покупателя; такая фотография попадает в «личное дело» клиента и используется в дальнейшем как один из способов подтверждения его присутствия на точке в момент подачи заявки на кредит.
К сожалению, всегда существует риск недобросовестного поведения агента, который может передавать в банк недостоверные фотографии – например, снимки клиентов из социальных сетей или паспорта.
Обычно банки решают эту задачу с помощью верификации фотографии – сотрудники офиса просматривают фотографии и пытаются выявить недостоверные изображения.
Мы захотели попробовать автоматизировать процесс и решить задачу с помощью нейросетей.
PIFR — метод генерации 3D-маски, независимо от угла поворота лица
2018-12-03 в 13:17, admin, рубрики: 3d-моделирование, computer vision, machine learning, глубокое обучение, искусственный интеллект, машинное обучение, нейронные сетиПредставлем вашему вниманию перевод статьи «PIFR: Pose Invariant 3D Face Reconstruction».
Во многих реальных приложениях, включая обнаружение и распознавание лиц, генерацию 3D-смайликов и стикеров, геометрию лица необходимо восстанавить из плоских изображений. Однако эта задача остается трудной, особенно когда большая часть информации о лице непознаваема.
Цзян и Ву из Университета Цзяннань (Китай) и Киттлер из Университета Суррея (Великобритания) предлагают новый алгоритм 3D-реконструкции лица — PIFR, который значительно увеличивает точность воссоздания даже в сложных позах.Читать полностью »
Вредоносное машинное обучение как диагностический метод
2018-11-10 в 8:48, admin, рубрики: Алгоритмы, безопасность, Блог компании Издательский дом «Питер», глубокое обучение, информационная безопасность, искусственный интеллект, машинное обучение, нейронные сети, распознавание образовПривет всем!
Продолжая проработку темы глубокого обучения, мы как-то раз хотели поговорить с вами о том, почему нейронным сетям повсюду мерещатся овцы. Эта тема рассмотрена в 9-й главе книги Франсуа Шолле.
Таким образом мы вышли на замечательные исследования компании «Positive Technologies», представленные на Хабре, а также на отличную работу двоих сотрудников MIT, считающих, что «вредоносное машинное обучение» — не только помеха и проблема, но и замечательный диагностический инструмент.
Далее — под катом.
Читать полностью »
Самые востребованные навыки в сфере data science
2018-10-16 в 8:58, admin, рубрики: data science, Блог компании Everyday Tools, глубокое обучение, карьера, Карьера в IT-индустрии, машинное обучение, поиск работы, работа с данными, Учебный процесс в ITВ плане знаний от специалистов по data science ждут многого: машинное обучение, программирование, статистика, математика, визуализация данных, коммуникация и глубокое обучение. Каждая из этих областей охватывает десятки языков, фреймворков, технологий, доступных для изучения. Так как же специалистам по работе с данными лучше распорядиться своим бюджетом времени на обучение, чтобы быть в цене у работодателей?
Я тщательно изучил сайты с вакансиями, чтобы выяснить, какие же навыки сейчас пользуются наибольшей популярностью у работодателей. Я рассматривал как более широкие дисциплины, связанные с работой с данными, так и конкретные языки и инструменты, в рамках отдельного исследования. За материалами я обратился к сайтам LinkedIn, Indeed, SimplyHired, Monster и AngelList, по состоянию на 10 октября 2018 года. На графике ниже показано, сколько вакансий по data science представлено на каждом из этих ресурсов.

Машинное обучение: схватка с комнатным слоном
2018-10-02 в 15:05, admin, рубрики: Wirex, Блог компании Wirex, глубокое обучение, искусственные нейронные сети, Исследования и прогнозы в IT, машинное обучение, распознавание изображений
Один — ноль в пользу человеческого мозга. В новом исследовании ученые-информатики выяснили, что системам искусственного интеллекта не удается пройти тест на зрительное распознавание объектов, с которым легко справится любой ребенок.
«Это качественное и важное исследование напоминает нам, что „глубокое обучение" на самом не может похвастаться той глубиной, которая ему приписывается», — говорит Гэри Маркус, нейробиолог из Нью-Йоркского университета, не связанный с этой работой.
Результаты исследования касаются сферы компьютерного зрения, когда системы искусственного интеллекта пытаются обнаружить и категоризировать объекты. Например, их могут попросить найти всех пешеходов в уличной сцене или просто отличить птицу от велосипеда — задание, которое уже успело прославиться своей сложностью.
Ставки высоки: компьютеры постепенно начинают выполнять за людей важные операции, такие как автоматическое видеонаблюдение и автономное вождение. И для успешной работы необходимо, чтобы способности ИИ к зрительной обработке как минимум не уступали человеческим.
Задача не из легких.Читать полностью »
Где и как врубиться в эмбеддинги графов
2018-09-25 в 11:00, admin, рубрики: graphSAGE, it-рекрутмент, neo4j, node2vec, pagerank, python, SAP HANA, snap, Алгоритмы, Блог компании Open Data Science, глубокое обучение, графовые сверточные сети, графы, командообразование, математика, машинное обучение, образование за рубежом, развлечения в интернете, рекомендательные системы, самообразование, Управление продуктом, управление проектами, эмбеддингиПривет!
Три года назад на сайте Леонида Жукова я ткнул ссылку на курс Юре Лесковека cs224w Analysis of Networks и теперь мы будем его проходить вместе со всеми желающими в нашем уютном чате в канале #class_cs224w. Cразу же после разминки с открытым курсом машинного обучения, который начнётся через несколько дней.
Вопрос: Что там начитывают?
Ответ: Современную математику. Покажем на примере улучшения процесса IT-рекрутинга.
Под катом читателя ждёт история о том, как руководителя проектов дискретная математика до нейросетей довела, почему внедряющим ERP и управляющим продуктами стоит почитывать журнал Биоинформатика, как появилась и решается задача рекомендации связей, кому нужны графовые эмбеддинги и откуда взялись, а также мнение о том, как перестать бояться вопросов про деревья на собеседованиях, и чего всё это может стоить. Погнали!Читать полностью »
Равномерно распределяем точки по сфере в pytorch и tensorflow
2018-09-24 в 12:11, admin, рубрики: backpropagation, function minimization, ml, povray, pytorch, TensorFlow, vapory, Блог компании HeadHunter, глубокое обучение, искусственный интеллект, математика, машинное обучение, оптимизацияЭтот текст написан для тех, кто интересуется глубоким обучением, кто хочет использовать разные методы библиотек pytorch и tensorflow для минимизации функции многих переменных, кому интересно научиться превращать последовательно выполняющуюся программу в выполняемые с помощью numpy векторизованные матричные вычисления. А ещё можно научиться делать мультфильм из данных, визуализированных с помощью PovRay и vapory.
Определяем спелость арбуза с помощью Keras: полный цикл, от идеи до программы на Google Play
2018-09-22 в 17:38, admin, рубрики: android, deep learning, java, neural networks, TensorFlow, глубокое обучение, искусственный интеллект, машинное обучениеС чего все началось
Все началось с Эппл Маркета — я обнаружил, что у них есть программа, позволяющая определить спелость арбуза. Программа… странная. Чего стоит, хотя бы, предложение постучать по арбузу не костяшками пальцев, а… телефоном! Тем не менее, мне захотелось повторить это достижение на более привычной платформе Андроид.
Читать полностью »