Привет!
Ну что ж, пожалуй, вы уже все знаете и о том, что такое DeepSeek, и о его бешеной популярности. Предлагаю разобраться, почему он вызвал такой большой интерес среди пользователей и разработчиков.
Привет!
Ну что ж, пожалуй, вы уже все знаете и о том, что такое DeepSeek, и о его бешеной популярности. Предлагаю разобраться, почему он вызвал такой большой интерес среди пользователей и разработчиков.
Публичный релиз DeepSeek, обрушивший капитализацию связанных с ИИ гигантов бигтеха на триллион долларов, и ставший самым громким событием с выхода в открытый доступ ChatGPT, напомнил многим об идущем стремительными темпами прогрессе в сфере LLM. И многие из тех людей, которые не нашли применения ChatGPT кроме как игрушки сразу после его релиза в конце 2022 года или даже не пробовали работать с нейросетями вообще, сейчас, уже почти 2,5 года спустя, могут обнаружить полезные, в первую очередь, в работе варианты применения нейросетей благодаря DeepSeek и его медийному эффекту.
Обычный парень становится всё более «бро».
Санта становится всё более «серьёзным».
Тренд быстро сошёл на нет, потому что все эти изображения были очень похожими и скучными; к тому же они необъяснимым образом все сводились к чему-то космическому, вне зависимости от исходного изображения и промта. Тем не менее, этот тренд достаточно любопытен с научной точки зрения тем, что столь бессмысленный и нечёткий промт каким-то образом влияет на конечное изображение, и что это изменение очевидно для пользователя.
А что будет, если я попробую похожий способ с кодом? Сгенерированный LLM код вряд ли будет мусорным (хоть это и возможно), поскольку он следует строгим правилам, и в отличие, например, от изображений, его качество можно измерить объективнее.
Если код в самом деле можно улучшить, просто при помощи интерактивного промтинга, попросив LLM «написать код получше» (хоть это и очень глупо), то это приведёт к огромному росту продуктивности. А если это так, то что произойдёт, если таких итераций с кодом будет слишком много? Каким станет эквивалент «космического» кода? Есть только один способ это выяснить!Читать полностью »
Всего за пару лет с момента запуска ChatGPT (конца 2022 года) крупные компании во многих отраслях успели испытать и внедрить эту технологию в реальные процессы. К 2025 году накоплено достаточно данных о том, где генеративный ИИ действительно приносит пользу – от обслуживания клиентов и финансовой аналитики до помощи программистам и даже медицины.
Банковский сектор одним из первых начал экспериментировать с ChatGPT для улучшения клиентского сервиса и внутренних операций. Morgan StanleyЧитать полностью »
При разработке приложений на основе больших языковых моделей (LLM, Large Language Model) встает вопрос: вызывать ли модель напрямую через API (например, OpenAI) или использовать специализированные фреймворки вроде LangChain или LangGraph. Ниже мы рассмотрим, с какими сложностями сталкивается разработчик при прямом использовании LLM, и как LangChain и LangGraph помогают упростить создание сложных диалоговых и агентных систем. Также приведем примеры кода, сравнивая прямые вызовы с использованием этих фреймворков, и обсудим, когда их применение оправдано.
7 декабря 1962 года журнал Life International опубликовал логическую головоломку, состоящую из 15 предложений, описывающих пять домов на улице. Каждое предложение содержало подсказку, например: «Англичанин живёт в красном доме» или «Молоко пьют в среднем доме». Каждый дом имел свой цвет, в нём проживали люди разных национальностей, у которых были разные домашние животные и другие характеристики. Заголовок статьи гласил: «Кому принадлежит зебра?» Подобные задачи стали примером для оценки возможностей, а также ограничений современных моделей машинного обучения.
Давайте будем честными.
В последние недели мир искусственного интеллекта (ИИ) был потрясен значительными достижениями китайских компаний, особенно DeepSeek и Alibaba, которые представили свои передовые модели — DeepSeek-R1 и Qwen 2.5-Max соответственно. Конечно же, эти события вызвали широкий резонанс в технологическом сообществе и привели к обсуждению будущего ИИ.
Меня зовут Роман Ленц, я начальник отдела анализа данных и машинного обучения ПГК Диджитал — цифровой дочки Первой грузовой компанииЧитать полностью »