Скорее всего все читатели Хабра слышали про chatGPT и знают как он работает. В этой статье, я повторю GPT и обучу на небольшом датасете, в основном пользуясь материалами из видео Andrej Karpathy. Спасибо за помощь в написании статьи и понимании того, что происходит команде из Школы Высшей Математики - у них одна из самых сильных команд по NLP и LLM с преподавателями из ВШЭ и ШАД.
Рубрика «llm» - 10
Построим GPT: с нуля и шаг за шагом
2024-10-15 в 15:19, admin, рубрики: chatgpt, chatgpt-4, chatgpt3.5, chatgpt4, gpt, llm, nlpИспользование ChatGPT для автоматизации генерации кода в JS-проекте
2024-10-15 в 13:05, admin, рубрики: chatgpt, grammy, javascript, llm, nodejs, regexp, teqfw, кодогенерацияВ своих предыдущих статьях о разработке телеграм-ботов я делился опытом создания базового функционала и работы с командами через аргументы (раз, два). На этапе подготовки третьей статьи передо мной встал вопрос генерации однотипного кода для новых команд, что превратилось в рутинную задачу. Чтобы избежать этого и ускорить процесс, я решил задействовать ChatGPT. К моему удивлению, его помощь оказалась значительно весомее, чем я ожидал.
От контекста до юрисдикции: 7 ключевых параметров при выборе LLM для вашего проекта
2024-10-15 в 9:18, admin, рубрики: chatgpt, llm, maas, OpenAI, openai api, qwen, внедрение ai, выбор модели, нейросети, языковые моделиПривет! Я Сергей, продакт направления AI в Битрикс24. Последний год мы активно внедряем нейросети в наш продукт, и я хочу поделиться опытом, который может сэкономить вам время и деньги.
Оказалось, что выбор правильной модели нейросети — это целое искусство. Размеры контекста, лицензии, поддержка языков, способы доступа — от этих параметров голова идет кругом. Но разобраться в них критически важно, если вы не хотите потратить кучу времени и денег впустую.
Почему AI не заменит программистов
2024-10-14 в 7:50, admin, рубрики: AI, llm, большие языковые модели, ИИ, искусственный интеллектВ эпоху быстрого развития AI и LLM я все чаще вижу, что многие люди думают AI заменят всех программистов и они будут не нужны. Такую мысль высказывал даже CEO Nvidia - Jensen Huang.
Но несмотря на впечатляющие достижения ИИ в области генерации кода, существует фундаментальное ограничение, которое не позволяет им полностью заменить человека в программировании — неспособность к настоящему рассуждению (reasoning).
Иллюзия интеллекта
ИИ без иллюзий. Развенчивание мифов
2024-10-13 в 6:20, admin, рубрики: apple, gpt, llm, nlp, OpenAI, генеративный ии, искусственный интеллект, машинное обучение, нейронные сетиВ своем подкасте я грозился сам почитать статью GSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Large Language Models ученых из Apple и разобраться. Почитал. Разобрался. Забавная статья. Забавная не по содержанию, а по выводам, которые можно сделать, если читать между строк и выйти за границы статьи.
Сначала совсем прямой смысл.
Сага об агенте или как LLM может помочь в разработке на Jmix
2024-10-11 в 14:21, admin, рубрики: AI Assistant, Jmix, llm, rag, агентыВсем привет! В последние годы большие языковые модели (LLM) стали набирать огромную популярность в решении множества задач, начиная от классического поиска по документам и заканчивая анализом финансовых новостей для принятия решений. В этой статье мы расскажем, как применили эти технологии для создания интеллектуального помощника, готового ответить на ваши вопросы по Jmix и помочь в написании кода.
Что такое Jmix AI Assistant?
Jmix AI Assistant — это агент на основе LLM, который может значительно ускорить вашу разработку на Jmix благодаря использованию четырех инструментов: поиска по актуальной версии Читать полностью »
Новая методика существенно повышает эффективность систем RAG в поиске необходимых документов
2024-10-11 в 14:18, admin, рубрики: bm25, llm, rag, искусственный интеллект, нейросети, эмбеддингиМетод генерации с дополнением извлечения (RAG) стал популярным способом связывания больших языковых моделей (LLM) с внешними источниками знаний. Системы RAG обычно используют модель эмбеддингов для кодирования документов в корпусе знаний и выбирают те, которые наиболее соответствуют запросу пользователя.
Дисклеймер 1: это вольный перевод заметкиЧитать полностью »
LLM агент для работы с Google Spreadsheets
2024-10-11 в 8:43, admin, рубрики: agents, llm, llm-приложения, АгентСалют! На связи Арсенин Никита из команды R&D в SberDevices. Сегодня я хочу рассказать про одно из наших направлений исследований — разработку агентских систем на основе больших языковых моделей.
Многие онлайн-сервисы предлагают доступ к проприетарным LLM. Однако по различным причинам может возникнуть необходимость использовать эти модели на своем оборудовании. Аренда серверов, особенно с GPU, может быть дорогой и зависит от требований к RAM/VRAM. Квантование моделей помогает снизить эти требования.
Итак, в этой статье мы:
-
Расскажем о квантовании и как оно помогает в выборе оборудованияЧитать полностью »