Рубрика «языковые модели» - 3
Как мы строим умный «файрвол» для LLM
2025-07-22 в 8:42, admin, рубрики: ai prompts, Ethical AI, llm-модели, искусственный интеллект, исследование, нейросети, фильтр, фреймфорк, этика, языковые моделиT-Pro 2.0 — открытая гибридно-ризонинговая русскоязычная LLM
2025-07-19 в 14:00, admin, рубрики: AI, ml, машинное обучение, языковые модели
Всем привет! На связи Толя Потапов, MLE в Т-Банке. Мы продолжаем развивать собственную линейку моделей GEN-TЧитать полностью »
Ключевые понятия LLM
2025-07-17 в 17:07, admin, рубрики: llm, llm-модели, ИИ, искуственный интеллект, нейросети, языковые моделиСовременные языковые модели (large language models) стали ключевым элементом в развитии искусственного интеллекта и обработки естественного языка.
Модели, основанные на глубоком обучении и архитектуре трансформеров, способны генерировать текст, отвечать на вопросы, писать код, создавать художественные произведения и даже участвовать в логических рассуждениях.
Как мы построили свой инструмент для работы с LLM
2025-07-02 в 8:01, admin, рубрики: AI, large language model, llm, llm-модели, большие языковые модели, инструментарий, искусственный интеллект, обработка данных, языковые моделиПривет, Habr! Меня зовут Алексей Рудак, и я основатель компании Lingvanex — компании, которая уже 7 лет делает решения для машинного перевода и распознавания речи.
В этой статье я бы хотел рассказать про наш инструмент для тренировки языковых моделей, который шесть лет назад родился из простого набора скриптов. Но постепенно усложняяcь, он стал включать в себя функции разметки данных, фильтрации датасетов, генерации данных и тестирования. В какой-то момент инструмент стал настолько функциональный, что я решил сделать ему красивый UI и назвать его - Data Studio.
Итак, что же такое Data Studio ?
Data StudioЧитать полностью »
«Тупой ИИ» с нами надолго. Почему в новых моделях больше галлюцинаций
2025-06-30 в 9:01, admin, рубрики: Chain-of-Thought, claude 3.7 sonnet, llm, lrm, ruvds_статьи, антропоморфизация, галлюцинации, дезинформация, рассуждающие модели, функция рассуждения, языковые модели
В последние несколько месяцев ведущие модели обновились с функцией «рассуждений» (reasoning). Предполагалось, что качество ответов улучшится. Но последующие тесты показали, что уровень галлюцинаций сильно вырос. И это не какая-то случайная недоработка разработчиков, а фундаментальное свойство. Сейчас становится очевидным, что от галлюцинаций мы не избавимся никогда. Читать полностью »
Вычисление функции потерь и градиентов в AI переводчике
2025-06-11 в 15:41, admin, рубрики: machinelearning, neural networks, Transformers, ИИ, искусственный интеллект, машинный перевод, переводчик, переводчики, языковые моделиПривет!
Меня зовут Алексей Рудак, я основатель компании Lingvanex, которая разрабатывает решения в области машинного перевода и транскрипции речи. Продолжаю цикл статей о том, как устроен переводчик на нейронных сетях изнутри. И сейчас хочу рассказать про работу функции потерь. Для тренировки модели используется opensource фреймворк OpenNMT-tf.
Оптимизация нейронных сетей для AI — переводчика
2025-06-09 в 11:18, admin, рубрики: AI, deeplearning, language model, machinelearning, translator, искусственный интеллект, машинный перевод, нейросети, языковые моделиВсем привет! Меня зовут Алексей Рудак, и я – основатель компании Lingvanex, которая уже 8 лет занимается решениями в области машинного перевода и транскрипции речи.
В этой статье рассматриваются несколько подходов, которые помогают повысить эффективность и качество языковых моделей для перевода. В качестве основы для тренировки моделей мы используем OpenNMT-tf.
OpenAI готовит релиз ChatGPT-5 — разбор утечек и ожиданий
2025-06-08 в 11:00, admin, рубрики: chatgpt, llm, OpenAI, нейросети, языковые модели
На прошедшей неделе Google выпустилаЧитать полностью »
Языковые модели для бизнеса: сравниваем малые (SLM) и большие (LLM) модели
2025-05-28 в 12:37, admin, рубрики: llm, ml, nlp, SLM, языковые моделиБольшие языковые модели (LLM) звучат впечатляюще, но всегда ли нужно их использовать? Разберемся, в каких случаях стоит использовать LLM, а когда использование малых языковых моделей (SLM) окажется более разумным и экономичным решением без потери качества.
В последние годы технологии искусственного интеллекта и обработки естественного языка (NLP) уверенно вошли в бизнес-практику. Их используют повсеместно — от анализа поведения клиентов до поддержки пользователей с помощью чат-ботов, автоматизированного маркетинга и многого другого.
Топ-100 нейросетей для генерации текста, кода, изображений, видео и аудио
2025-05-28 в 9:05, admin, рубрики: chatgpt, gpt, llm, midjourney, timeweb_статьи, контент, нейросети, подборка, сервисы, языковые моделиПосле громкого дебюта ChatGPT и Midjourney в 2022 году нейросети стали появляться как грибы после дождя. Интернет наполнился большим количеством сервисов, предлагающих генерацию текста, кода, изображений, видео и аудио по текстовым запросам.
Разумеется, многие из таких сервисов существовали и раньше, однако именно на 2022 и 2023 годы пришелся их рассвет — настолько стремительный и яркий, что неподготовленный пользователь может легко заблудиться в этом новом направлении.

