Главная

Рубрика «llm-модели»

Комплексное руководство по конфигурации сервера для LLM

2025-03-17 в 15:15, admin, рубрики: llama, llm, llm-модели, сервер

Привет! Развертывание языковой модели на собственном сервере требует тщательного планирования аппаратной составляющей. В этой статье мы разберем, какие компоненты критически важны для эффективной работы LLM, как они взаимодействуют, и какую конфигурацию выбрать под разные сценарии использования.

Читать полностью »

Модели T-lite и T-pro: training report

2025-03-12 в 14:30, admin, рубрики: llm-модели, распознавание текста, языковые модели

Привет! Я Дима Стоянов, MLE в команде разработки фундаментальных моделей. Мы продолжаем рассказывать о наших моделях T-lite и T-pro. Общие характеристики и результаты бенчмарков описывали в предыдущей публикации. В этой статье раскроем детали предобучения: от подготовки данных до финальных экспериментов, а совсем скоро поделимся особенностями этапа post-training.

Читать полностью »

Русскоязычные LLM: отечественные разработки в сравнении с глобальными адаптациями

2025-03-06 в 13:11, admin, рубрики: api, chatgpt, cotype, GigaChat, llm-модели, нейросети, сравнение моделей, языковые модели

Современные языковые модели (они же LLM, они же Large Language Models) становятся все более востребованными практически во всех сферах. LLM уже не просто инструмент, а важнейшая часть технологического прогресса, позволяющая автоматизировать работу с текстами, проводить анализ данных, генерировать контент и даже серьезно помогать в обучении.

Читать полностью »

Мама, у меня RAG: пути к улучшению, когда он «наивный»

2025-02-25 в 18:45, admin, рубрики: genai, graph rag, graphrag, knowledge graph, llm-модели, rag, retrival augumented generation, semantic search, ИИ и машинное обучение

В последние пару лет RAG (retrieval-augmented generation) стал одной из самых обсуждаемых технологий в области обработки текстов и поисковых систем. Его идея проста: объединить поиск (retrieval) и генерацию (generation), чтобы быстрее находить нужную информацию и создавать более точные тексты.

Читать полностью »

Научим AI краснеть: автоматизация в Adult индустрии

2025-02-18 в 11:21, admin, рубрики: llm-модели

Как известно, интернет был придуман чтобы было куда скидывать фотки ню, и действительно adult media индустрия это хороший индикатор развития какой либо технологии. А что же с ИИ? Использование ИИ в колл-центрах и пользовательской поддержке уже стало обычным делом. Но что, если вы хотите применить его в более специализированной отрасли, например, для создания NSFW-чатботов или автоматизации на платформах вроде OnlyFans или для симуляторов дейтинга?

Читать полностью »

Так ли хороша DeepSeek-R1, как о ней говорят

2025-02-17 в 10:52, admin, рубрики: deepseek, DeepSeek R1, gpt-4, llm-модели, o1-mini, OpenAI, qwen2.5-max, сравнение

Во всем AI-мире сейчас говорят о новой китайской языковой модели DeepSeek и, конечно, наша команда развития AI не могла пройти мимо этой темы. Мы сравнили ответы новой модели на реальные запросы к нашей технической поддержке с ответами других популярных моделей. Что из этого получилось и какие выводы мы сделали расскажу я — Максим Михайлов, продуктовый менеджер Cloud.ru.

Читать полностью »

Как научить модель рассуждать, не переобучая её, меньше чем за 10$

2025-02-13 в 19:33, admin, рубрики: llm, llm-архитектура, llm-модели

Введение

Это статья обобщение моего исследования передачи знаний от большой модели с замороженными весами в малую модель, которую мы будем обучать через расширенный механизм кросс внимания или проще говоря через LLM модули. Оригинальное исследование доступно по ссылке: arxiv.org/abs/2502.08213 . Репозиторий с кодом и весами доступен на Hugging Face: LLM модули.

Читать полностью »

LLM Llama 3 — небольшое погружение в детали

2025-02-04 в 15:29, admin, рубрики: llama 3, llama3, llm, llm-модели, искусственный интеллект, нейросети

Привет! В этой статье я попробую немного разобрать код LLM Llama 3. Полностью проанализировать каждую строку кода не получится, но самые важные и базовые концепции мы все-таки разберем насколько это возможно.

Падаем в кроличью нору

LLM Llama 3 — небольшое погружение в детали - 1

Изучать мы будем класс Llama (файл generation.py) и его метод text_completionЧитать полностью »

Всё, что я узнал о запуске локальных языковых моделей

2025-01-31 в 14:53, admin, рубрики: AI, llm, llm-модели, ИИ, искусственный интеллект, локальный chatgpt, перевод

В мире, где облачные решения диктуют свои правила, локальные модели дают свободу — полную приватность, работу офлайн и отсутствие ограничений. Эта статья для тех, кто хочет впервые попробовать самостоятельно запустить LLM на своем компьютере.

Читать полностью »

Deepseek v3: Как скачать китайскую нейросеть Дипсик AI, все способы

2025-01-29 в 21:40, admin, рубрики: deepseek, DeepSeek R1, deepseek v3, llm, llm-модели, дипсик, ИИ, ии-ассистент, нейросети, нейросеть

Дипсик R1 - нашумевшая ИИ модель от китайской компании Deepseek AI. За основу взята модель Deepseek v3, возможности которой схожи с ChatGPT. Однако благодаря открытому исходному коду китайской нейросети у нее есть ряд интересных преимуществ.

В этой статье собрал все способы установки Дипсик. Т.к. китайская нейросеть с открытым исходным кодом – ее можно скачать на компьютер и использовать без Интернета. Причем, в удобном интерфейсе чат-бота.

1. Самый простой (но не всегда рабочий) способ: через сайт Deepseek

Переходим на официальный сайт chat.deepseek.com Читать полностью »

Публикации RSS | Комментарии RSS

https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js

Информация

Обсуждаемое

Рекомендуем

Рубрика «llm-модели»

Комплексное руководство по конфигурации сервера для LLM

Модели T-lite и T-pro: training report

Русскоязычные LLM: отечественные разработки в сравнении с глобальными адаптациями

Мама, у меня RAG: пути к улучшению, когда он «наивный»

Научим AI краснеть: автоматизация в Adult индустрии

Так ли хороша DeepSeek-R1, как о ней говорят

Как научить модель рассуждать, не переобучая её, меньше чем за 10$

Введение

LLM Llama 3 — небольшое погружение в детали

Падаем в кроличью нору

Всё, что я узнал о запуске локальных языковых моделей

Deepseek v3: Как скачать китайскую нейросеть Дипсик AI, все способы

1. Самый простой (но не всегда рабочий) способ: через сайт Deepseek

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «llm-модели»

Введение

Падаем в кроличью нору

1. Самый простой (но не всегда рабочий) способ: через сайт Deepseek

Новости

Актуальные темы

Архив