Главная

Рубрика «llm» - 3

DeepSeek и Qwen 2.5 против ChatGPT: как китайские компании запустили новый скачок в мире ИИ

2025-02-06 в 15:39, admin, рубрики: AI, chatgpt, deepseek, DeepSeek R1, llm, qwen2.5-max, ИИ, ии-модель

В последние недели мир искусственного интеллекта (ИИ) был потрясен значительными достижениями китайских компаний, особенно DeepSeek и Alibaba, которые представили свои передовые модели — DeepSeek-R1 и Qwen 2.5-Max соответственно. Конечно же, эти события вызвали широкий резонанс в технологическом сообществе и привели к обсуждению будущего ИИ.

Меня зовут Роман Ленц, я начальник отдела анализа данных и машинного обучения ПГК Диджитал — цифровой дочки Первой грузовой компании Читать полностью »

LLM в науке, тюнинг и регулирование систем ИИ

2025-02-06 в 15:23, admin, рубрики: gpu, llm, вычисления, ИИ, наука

Продолжим рассказ о том, для чего можно использовать виртуальную инфраструктуру с GPU. Сегодня поговорим о том, какие ИИ пишут научные статьи, кто оптимизирует LLM с помощью других LLM, а также затронем регулирование систем ИИ.

Мечта студента

Читать полностью »

Программист за $4000 против ChatGPT за $20: кто победит в 2025?

2025-02-06 в 14:30, admin, рубрики: chatgpt, copilot, llm, зарплата программиста, кадры, Программирование, промт-инженеры, промтинг, разработка, увольнения

Читать полностью »

Model Context Protocol (MCP): Стандартизация взаимодействия AI-приложений

2025-02-06 в 8:23, admin, рубрики: AI, claude, cursor, llm, MCP, OpenAI

Где-то летом 2024 года в некоторых OpenAI сервисах появилась возможность использовать "инструменты".
Инструмент — это функция, которая выполняется на сервере и возвращает некий результат. Например, в ChatGPT можно было использовать инструменты для поиска информации в интернете, для генерации изображений и т.д.

Это был закрытый API, который использовался внутри OpenAI, и как и что там происходило было довольно туманно.

Anthropic (создатель Claude) совершил мини-революцию в AI инструментарии, создав открытый протокол MCP с расширенными возможностями для создания подобных инструментов и даже больше.

Читать полностью »

Используем LLM, чтобы упорядочить личную библиотеку электронных книг и статей arXiv

2025-02-05 в 20:30, admin, рубрики: llm, библиотека

Читать полностью »

DeepSeek vs Mixtral: что безопаснее использовать для корпоративного чат-бота?

2025-02-05 в 10:05, admin, рубрики: AI RedTeaming, AI Security, deepseek, llm, mixtral, rag

Языковая модель DeepSeek R1 наделала много шума в начале этого года. Сначала в AI-сообществе с восхищением обсуждали, как китайцам удалось получить качество генерации текста на уровне передовых западных моделей при меньших затратах на обучение. Затем восторг сменился жёсткой критикой о политической предвзятости, копировании моделей OpenAI и доступности истории запросов Читать полностью »

Помочь искусственному интеллекту «погулять» по Интернету

2025-02-05 в 9:10, admin, рубрики: deepseek, llm, python

Дело было вечером - делать было нечего

Технологии искусственного интеллекта (далее - ИИ) стремительно развиваются. Эта сфера является для меня новой и Я ещё не успел в ней глубоко разобраться. Меня в основном интересуют текстовые генеративные модели - то есть чаты, с которыми можно поговорить как с человеком. Количество предложений в мире постепенно увеличивается и скоро закончатся пальцы на руках чтобы их перечислить. Так, недавно появившийся DeepSeek (далее - Читать полностью »

Карта рынка российского GenAI и сопутствующих продуктов

2025-02-05 в 8:41, admin, рубрики: AI, llm, ИИ, искусственный интеллект, карта рынка, нейросети

Мы представляем карту российских компаний, которые занимаются созданием решений на основе генеративного ИИ, а также сопутствующих инструментов. Полная версия карты доступна по ссылке.

На карту попали решения из следующих сфер:

Разработка больших языковых моделей (LLM)
Читать полностью »

Ускорение LLM: универсальные методы для популярных архитектур

2025-02-05 в 7:00, admin, рубрики: llm, ml, инференс, нейросети

Читать полностью »

ИИ простыми словами, часть 1. Архитектура Mixture of Experts (MoE)

2025-02-04 в 17:53, admin, рубрики: deepseek, llm, mixture of experts, r1, искусственный интеллект

Когда я пишу новости про ИИ, то часто сталкиваюсь с проблемой: они пестрят техническими терминами, которые не всегда понятны даже людям использующим ИИ регулярно. SFT, MoE, RL/RLHF/DPO, миллионы их.

Я захотел описать самые популярные термины простым русским языком, чтобы каждый, даже нетехнический человек, мог разобраться в самой главной технологии современности. Чтобы, когда я пишу на Хабр или куда-то ещё, для сложных терминов я сразу мог бы дать ссылку на понятное и простое объяснение.

Читать полностью »

Публикации RSS | Комментарии RSS

https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js

Информация

Обсуждаемое

Рекомендуем

Рубрика «llm» - 3

DeepSeek и Qwen 2.5 против ChatGPT: как китайские компании запустили новый скачок в мире ИИ

LLM в науке, тюнинг и регулирование систем ИИ

Мечта студента

Программист за $4000 против ChatGPT за $20: кто победит в 2025?

Model Context Protocol (MCP): Стандартизация взаимодействия AI-приложений

Используем LLM, чтобы упорядочить личную библиотеку электронных книг и статей arXiv

DeepSeek vs Mixtral: что безопаснее использовать для корпоративного чат-бота?

Помочь искусственному интеллекту «погулять» по Интернету

Карта рынка российского GenAI и сопутствующих продуктов

Ускорение LLM: универсальные методы для популярных архитектур

ИИ простыми словами, часть 1. Архитектура Mixture of Experts (MoE)

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «llm» - 3

Мечта студента

Новости

Актуальные темы

Архив