Рубрика «языковые модели» - 3

Как мы строим умный «файрвол» для LLM

2025-07-22 в 8:42, admin, рубрики: ai prompts, Ethical AI, llm-модели, искусственный интеллект, исследование, нейросети, фильтр, фреймфорк, этика, языковые модели

Читать полностью »

T-Pro 2.0 — открытая гибридно-ризонинговая русскоязычная LLM

2025-07-19 в 14:00, admin, рубрики: AI, ml, машинное обучение, языковые модели

Всем привет! На связи Толя Потапов, MLE в Т-Банке. Мы продолжаем развивать собственную линейку моделей GEN-TЧитать полностью »

Ключевые понятия LLM

2025-07-17 в 17:07, admin, рубрики: llm, llm-модели, ИИ, искуственный интеллект, нейросети, языковые модели

Современные языковые модели (large language models) стали ключевым элементом в развитии искусственного интеллекта и обработки естественного языка.

Модели, основанные на глубоком обучении и архитектуре трансформеров, способны генерировать текст, отвечать на вопросы, писать код, создавать художественные произведения и даже участвовать в логических рассуждениях.

Читать полностью »

Как мы построили свой инструмент для работы с LLM

2025-07-02 в 8:01, admin, рубрики: AI, large language model, llm, llm-модели, большие языковые модели, инструментарий, искусственный интеллект, обработка данных, языковые модели

Привет, Habr! Меня зовут Алексей Рудак, и я основатель компании Lingvanex — компании, которая уже 7 лет делает решения для машинного перевода и распознавания речи.

В этой статье я бы хотел рассказать про наш инструмент для тренировки языковых моделей, который шесть лет назад родился из простого набора скриптов. Но постепенно усложняяcь, он стал включать в себя функции разметки данных, фильтрации датасетов, генерации данных и тестирования. В какой-то момент инструмент стал настолько функциональный, что я решил сделать ему красивый UI и назвать его - Data Studio.

Итак, что же такое Data Studio ?

Data StudioЧитать полностью »

«Тупой ИИ» с нами надолго. Почему в новых моделях больше галлюцинаций

2025-06-30 в 9:01, admin, рубрики: Chain-of-Thought, claude 3.7 sonnet, llm, lrm, ruvds_статьи, антропоморфизация, галлюцинации, дезинформация, рассуждающие модели, функция рассуждения, языковые модели

В последние несколько месяцев ведущие модели обновились с функцией «рассуждений» (reasoning). Предполагалось, что качество ответов улучшится. Но последующие тесты показали, что уровень галлюцинаций сильно вырос. И это не какая-то случайная недоработка разработчиков, а фундаментальное свойство. Сейчас становится очевидным, что от галлюцинаций мы не избавимся никогда. Читать полностью »

Вычисление функции потерь и градиентов в AI переводчике

2025-06-11 в 15:41, admin, рубрики: machinelearning, neural networks, Transformers, ИИ, искусственный интеллект, машинный перевод, переводчик, переводчики, языковые модели

Привет!

Меня зовут Алексей Рудак, я основатель компании Lingvanex, которая разрабатывает решения в области машинного перевода и транскрипции речи. Продолжаю цикл статей о том, как устроен переводчик на нейронных сетях изнутри. И сейчас хочу рассказать про работу функции потерь. Для тренировки модели используется opensource фреймворк OpenNMT-tf.

Читать полностью »

Оптимизация нейронных сетей для AI — переводчика

2025-06-09 в 11:18, admin, рубрики: AI, deeplearning, language model, machinelearning, translator, искусственный интеллект, машинный перевод, нейросети, языковые модели

Всем привет! Меня зовут Алексей Рудак, и я – основатель компании Lingvanex, которая уже 8 лет занимается решениями в области машинного перевода и транскрипции речи.

В этой статье рассматриваются несколько подходов, которые помогают повысить эффективность и качество языковых моделей для перевода. В качестве основы для тренировки моделей мы используем OpenNMT-tf.

Читать полностью »

OpenAI готовит релиз ChatGPT-5 — разбор утечек и ожиданий

2025-06-08 в 11:00, admin, рубрики: chatgpt, llm, OpenAI, нейросети, языковые модели

На прошедшей неделе Google выпустила Читать полностью »

Языковые модели для бизнеса: сравниваем малые (SLM) и большие (LLM) модели

2025-05-28 в 12:37, admin, рубрики: llm, ml, nlp, SLM, языковые модели

Большие языковые модели (LLM) звучат впечатляюще, но всегда ли нужно их использовать? Разберемся, в каких случаях стоит использовать LLM, а когда использование малых языковых моделей (SLM) окажется более разумным и экономичным решением без потери качества.

В последние годы технологии искусственного интеллекта и обработки естественного языка (NLP) уверенно вошли в бизнес-практику. Их используют повсеместно — от анализа поведения клиентов до поддержки пользователей с помощью чат-ботов, автоматизированного маркетинга и многого другого.

Читать полностью »

Топ-100 нейросетей для генерации текста, кода, изображений, видео и аудио

2025-05-28 в 9:05, admin, рубрики: chatgpt, gpt, llm, midjourney, timeweb_статьи, контент, нейросети, подборка, сервисы, языковые модели

После громкого дебюта ChatGPT и Midjourney в 2022 году нейросети стали появляться как грибы после дождя. Интернет наполнился большим количеством сервисов, предлагающих генерацию текста, кода, изображений, видео и аудио по текстовым запросам.

Разумеется, многие из таких сервисов существовали и раньше, однако именно на 2022 и 2023 годы пришелся их рассвет — настолько стремительный и яркий, что неподготовленный пользователь может легко заблудиться в этом новом направлении.

Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «языковые модели» - 3

Как мы строим умный «файрвол» для LLM

T-Pro 2.0 — открытая гибридно-ризонинговая русскоязычная LLM

Ключевые понятия LLM

Как мы построили свой инструмент для работы с LLM

«Тупой ИИ» с нами надолго. Почему в новых моделях больше галлюцинаций

Вычисление функции потерь и градиентов в AI переводчике

Оптимизация нейронных сетей для AI — переводчика

OpenAI готовит релиз ChatGPT-5 — разбор утечек и ожиданий

Языковые модели для бизнеса: сравниваем малые (SLM) и большие (LLM) модели

Топ-100 нейросетей для генерации текста, кода, изображений, видео и аудио