Рубрика «обучение с подкреплением»

В этой короткой статье собраны самые разные способы, как сделать обучение эффективным.

Это не система, а именно набор рекомендаций: чем больше вы наберёте, тем больше вероятность, что обучение будет полезным и усвоится.

В конце привожу чек-лист, который вам поможет проверить, какому количество пунктов вы или ваши сотрудники соответствуете.

P.S. Большая часть пунктов основывается на исследованиях, которые я мог упоминать в своих прежних публикациях. Чтобы избежать повторений, я их не указываю в случае повторений.

Наличие резервов

Читать полностью »

Материал ниже разбирает один достаточно своеобразный и пугающий феномен. Современные модели искусственного интеллекта находятся примерно на младенческом уровне развития. Их взросление и понимание истинной картины мира сдерживается человеческим мышлением, логикой и языком, на которых эти модели обучались. В развитии искусственный интеллект не просто отринет все человеческое, а переосмыслит его. И это происходит уже сейчас.

Читать полностью »

Введение

В последние годы наблюдается значительный рост общих возможностей искусственного интеллекта, однако, создание открытых систем ИИ, которые постоянно самосовершенствуются, остается недостижимым. 

В этой статье приводятся подтверждения того, что сейчас есть все необходимые компоненты для достижения открытости в ИИ-системах с точки зрения человеческого наблюдателя, а также доказывается, что такая открытость является важнейшим свойством сверхчеловеческого искусственного интеллекта (ASI).

Читать полностью »

ChatGPT — лучший помощник программиста. Примеры реальных задач. Плагины и инструменты - 1


Языковая модель ChatGPT никогда не заменит программиста, потому что непосредственно редактирование кода — это крохотная часть разработки (5% по времени). Зато ChatGPT великолепно помогает. И чем выше ваш скилл — тем больше пользы от «подмастерья», выполняющего мелкие задания и черновой кодинг. Он пишет простые функции, генерирует документацию, находит и объясняет ошибки, выполняет кучу других задач (полный список под катом).

Сегодня не использовать ChatGPT просто глупо… Это действительно универсальный помощник, который сильно облегчает жизнь и выводит программирование на принципиально новый уровень. Одно из величайших изобретений в IT за десятилетия, после GUI и интернета.

Пожалуй, никогда программирование не было настолько приятным и эффективным, как сейчас.
Читать полностью »

Рисуем Мону Лизу используя глубокое обучение с подкреплением

Как нарисовать Мону Лизу без кистей и красок? - 1

Пост написан специально для всех любителей искусства (и, возможно, машинного обучения).

На самом деле, специально для лучшего курса по ML.

Читать полностью »

Постановка задачи

Обучение с подкреплением молодая и бурно растущая дисциплина. Это обстоятельство привело к тому что информации об этом на русском языке почти нет. Особенно, если дело касается объектно-ориентированного подхода, и практических задач не из арсенала "качалки".

Представляю вам результат простой задачи, которая как я надеюсь, убережет вас от части шишек встречающихся на этом интересном пути.

Предположим задачу, в которой нано робот с антибиотиком должен подобраться к скоплению патогенных бактерий для их уничтожения.

Загрузим Reinforsment Learning от Keras и библиотеку для анимации.

Читать полностью »

ИИ снова победил пилота F-16 в воздушном бою - 1

В истории о машинах, побеждающих людей, появилась новая глава: ИИ снова победил пилота-человека в виртуальном воздушном бою. Соревнование AlphaDogfight стало финалом испытаний нейросетевых алгоритмов, разработанных для американских вооруженных сил. И наилучшей демонстрацией возможностей интеллектуальных автономных агентов, способных победить вражеские самолеты в воздушном бою. Подробнее — в материале Cloud4Y.Читать полностью »

image

Компания Deep Mind, занимающаяся разработкой искусственного интеллекта, создала ИИ Agent57 с глубоким обучением, который получил среднюю оценку во всех 57 играх приставки Atari 2600 выше, чем человек, сообщается на сайте Deep Mind. Читать полностью »

ИИ, пытающийся избежать проблем, научился сложному поведению - 1

В обучении с подкреплением (Reinforcement Learning) часто используется любопытство в качестве мотивации для ИИ. Заставляющее его искать новые ощущения и исследовать окружающий мир. Но жизнь полна неприятных сюрпризов. Можно упасть с обрыва и с точки зрения любопытства это всегда будут очень новые и интересные ощущения. Но явно не то, к чему надо стремиться.

Разработчики из Berkeley перевернули задачу для виртуального агента с ног на голову: главной мотивирующей силой сделали не любопытство, а наоборот — стремление всеми силами избегать любой новизны. Но "ничего не делать" оказалось сложнее, чем кажется. Будучи помещенным в постоянно меняющийся окружающий мир, ИИ пришлось обучиться сложному поведению, чтобы избегать новых ощущений.

Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js