Главная

Рубрика «llm-модели» - 2

Мама, у меня RAG: пути к улучшению, когда он «наивный»

2025-02-25 в 18:45, admin, рубрики: genai, graph rag, graphrag, knowledge graph, llm-модели, rag, retrival augumented generation, semantic search, ИИ и машинное обучение

В последние пару лет RAG (retrieval-augmented generation) стал одной из самых обсуждаемых технологий в области обработки текстов и поисковых систем. Его идея проста: объединить поиск (retrieval) и генерацию (generation), чтобы быстрее находить нужную информацию и создавать более точные тексты.

Читать полностью »

Научим AI краснеть: автоматизация в Adult индустрии

2025-02-18 в 11:21, admin, рубрики: llm-модели

Как известно, интернет был придуман чтобы было куда скидывать фотки ню, и действительно adult media индустрия это хороший индикатор развития какой либо технологии. А что же с ИИ? Использование ИИ в колл-центрах и пользовательской поддержке уже стало обычным делом. Но что, если вы хотите применить его в более специализированной отрасли, например, для создания NSFW-чатботов или автоматизации на платформах вроде OnlyFans или для симуляторов дейтинга?

Читать полностью »

Так ли хороша DeepSeek-R1, как о ней говорят

2025-02-17 в 10:52, admin, рубрики: deepseek, DeepSeek R1, gpt-4, llm-модели, o1-mini, OpenAI, qwen2.5-max, сравнение

Во всем AI-мире сейчас говорят о новой китайской языковой модели DeepSeek и, конечно, наша команда развития AI не могла пройти мимо этой темы. Мы сравнили ответы новой модели на реальные запросы к нашей технической поддержке с ответами других популярных моделей. Что из этого получилось и какие выводы мы сделали расскажу я — Максим Михайлов, продуктовый менеджер Cloud.ru.

Читать полностью »

Как научить модель рассуждать, не переобучая её, меньше чем за 10$

2025-02-13 в 19:33, admin, рубрики: llm, llm-архитектура, llm-модели

Введение

Это статья обобщение моего исследования передачи знаний от большой модели с замороженными весами в малую модель, которую мы будем обучать через расширенный механизм кросс внимания или проще говоря через LLM модули. Оригинальное исследование доступно по ссылке: arxiv.org/abs/2502.08213 . Репозиторий с кодом и весами доступен на Hugging Face: LLM модули.

Читать полностью »

LLM Llama 3 — небольшое погружение в детали

2025-02-04 в 15:29, admin, рубрики: llama 3, llama3, llm, llm-модели, искусственный интеллект, нейросети

Привет! В этой статье я попробую немного разобрать код LLM Llama 3. Полностью проанализировать каждую строку кода не получится, но самые важные и базовые концепции мы все-таки разберем насколько это возможно.

Падаем в кроличью нору

LLM Llama 3 — небольшое погружение в детали - 1

Изучать мы будем класс Llama (файл generation.py) и его метод text_completionЧитать полностью »

Всё, что я узнал о запуске локальных языковых моделей

2025-01-31 в 14:53, admin, рубрики: AI, llm, llm-модели, ИИ, искусственный интеллект, локальный chatgpt, перевод

В мире, где облачные решения диктуют свои правила, локальные модели дают свободу — полную приватность, работу офлайн и отсутствие ограничений. Эта статья для тех, кто хочет впервые попробовать самостоятельно запустить LLM на своем компьютере.

Читать полностью »

Deepseek v3: Как скачать китайскую нейросеть Дипсик AI, все способы

2025-01-29 в 21:40, admin, рубрики: deepseek, DeepSeek R1, deepseek v3, llm, llm-модели, дипсик, ИИ, ии-ассистент, нейросети, нейросеть

Дипсик R1 - нашумевшая ИИ модель от китайской компании Deepseek AI. За основу взята модель Deepseek v3, возможности которой схожи с ChatGPT. Однако благодаря открытому исходному коду китайской нейросети у нее есть ряд интересных преимуществ.

В этой статье собрал все способы установки Дипсик. Т.к. китайская нейросеть с открытым исходным кодом – ее можно скачать на компьютер и использовать без Интернета. Причем, в удобном интерфейсе чат-бота.

1. Самый простой (но не всегда рабочий) способ: через сайт Deepseek

Переходим на официальный сайт chat.deepseek.com Читать полностью »

Telegram бот + ИИ Jlama своими руками

2025-01-29 в 17:27, admin, рубрики: AI, artificial intelligence, java, llm, llm-модели, llm-приложения, spring, telegram, ИИ, искусственный интеллект

Сегодня мы попробуем сделать свой ИИ с телеграм ботом для возможности простого общения с ней. Сразу оговорюсь, мы не будем в очередной раз использовать открытый API ChatGPT или новомодного Deepseek. Мы развернем свой полноценный ИИ локально и сынтегрируем его с телеграм ботом.

LLM модель

Telegram бот + ИИ Jlama своими руками - 1

Читать полностью »

Почему DeepSeek Janus-7B — это нечто действительно невероятное

2025-01-27 в 20:05, admin, рубрики: deepseek, janus, janus-pro, llamagen, llm, llm-модели

Полчаса назад вышла новость о выходе DeepSeek Janus-7B - новой мультимодальной модели от DeepSeek, которая, по заявлениям авторов, рвёт DALL-E 3, Stable Diffusion XL и Stable Diffusion 3 (Medium) в бенчмарках.

В этой статье я не буду дублировать новость, а хочу подробнее рассмотреть, что именно в этой модели такого уникального, из-за чего многие связанные с AI медиа сегодня захлебываются от восторга.

Читать полностью »

Субъективный взгляд на перспективы Больших Языковых Моделей

2025-01-24 в 19:26, admin, рубрики: AGI, AI, llm, llm-модели, ИИ

Прошло около полугода после последней моей статьи о перспективах развития больших языковых моделей. Чтобы не утомлять долгим чтением, её краткое резюме:
Критика современных больших языковых моделей (БЯМ): они статичны, неэффективны в вычислениях и обучении, что ведет индустрию к технологическому тупику. Главные проблемы связаны с экспоненциальным ростом вычислительных мощностей, дефицитом качественных данных и ограничениями архитектуры.

Итак, можно подвести некоторые итоги, что же мы увидели за прошедшее время.

Читать полностью »

Публикации RSS | Комментарии RSS

https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js

Информация

Обсуждаемое

Рекомендуем

Рубрика «llm-модели» - 2

Мама, у меня RAG: пути к улучшению, когда он «наивный»

Научим AI краснеть: автоматизация в Adult индустрии

Так ли хороша DeepSeek-R1, как о ней говорят

Как научить модель рассуждать, не переобучая её, меньше чем за 10$

Введение

LLM Llama 3 — небольшое погружение в детали

Падаем в кроличью нору

Всё, что я узнал о запуске локальных языковых моделей

Deepseek v3: Как скачать китайскую нейросеть Дипсик AI, все способы

1. Самый простой (но не всегда рабочий) способ: через сайт Deepseek

Telegram бот + ИИ Jlama своими руками

LLM модель

Почему DeepSeek Janus-7B — это нечто действительно невероятное

Субъективный взгляд на перспективы Больших Языковых Моделей

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «llm-модели» - 2

Введение

Падаем в кроличью нору

1. Самый простой (но не всегда рабочий) способ: через сайт Deepseek

LLM модель

Новости

Актуальные темы

Архив