Рубрика «llm» - 6
Telegram бот + ИИ Jlama своими руками
2025-01-29 в 17:27, admin, рубрики: AI, artificial intelligence, java, llm, llm-модели, llm-приложения, spring, telegram, ИИ, искусственный интеллектНи дня не проходит, чтобы не появилась какая‑нибудь статья об LLM. И каждый раз, читая их, мне, как старому деду, хочется воскликнуть: «Вы всё делаете неправильно! Какое принятие решений? Какие математические расчёты? А вот в pet проекте - ей самое место!»
Почти у каждого разработчика, который имеет хоть немного свободного времени, есть свои домашние проекты. Обычно они характеризуются малым временем на разработку, применением только для себя любимого или ближайшего круга лиц и большей лояльностью к защите от дурака.
Читать полностью »
Если шутка не смешная. Часть 2. Я беру мрамор и отсекаю всё лишнее
2025-01-28 в 13:51, admin, рубрики: gpt4o, llm, культурные реалии, субтитры, фильмыВ первой части статьи я рассказывала о том, как извлекала культурные реалии из субтитров фильмов. Теперь пришло время оптимизировать сам подход, скрипт и результаты анализа. В этот раз я обработала все четыре сезона любимого многими яркого и отдыхающего сериала Emily in Paris и узнала, например, что "hemorrhaging clients" — это отнюдь не "геморройные клиенты" и даже не клиенты с геморроем в медицинском смысле, а стремительная потеря клиентов (по аналогии с кровотечением, которое, как мы знаем, "hemorrhage" на английском). Узнала, что раскованные французы поднимают бокалы с возгласом Tchin-tchin!, Читать полностью »
Как работает модель DeepSeek-R1. Объясняем в иллюстрациях и схемах
2025-01-28 в 13:26, admin, рубрики: AI, artificial intelligence, deepseek, DeepSeek R1, deepseek v3, llm, nature, большие языковые модели, ИИ, искусственный интеллектDeepSeek-R1 — это самый громкий релиз последних дней в области искусственного интеллекта. Для сообщества исследователей и разработчиков машинного обучения (ML R&D) эта модель имеет особое значение по ряду причин:
-
Модель обладает открытыми весами и включает уменьшенные, дистиллированные варианты.
-
Она делится и размышляет над методом обучения, позволяющим воспроизвести модель рассуждений, подобную OpenAI O1.
В этой публикации мы рассмотрим, как была создана DeepSeek-R1.
Дисклеймер: это вольный перевод статьиЧитать полностью »
Альтернативы ChatGPT на смартфонах без интернета: как установить и использовать локальные языковые модели на iPhone
2025-01-28 в 9:28, admin, рубрики: gpt, llama, llm, xcom-shop
Несмотря на то, что искусственный интеллект только начал входить в нашу жизнь, он уже перестал быть привилегией супер-компьютеров и облачных платформ. Теперь даже не самые новые iPhone способны нативно запускать продвинутые языковые моделиЧитать полностью »
Почему DeepSeek Janus-7B — это нечто действительно невероятное
2025-01-27 в 20:05, admin, рубрики: deepseek, janus, janus-pro, llamagen, llm, llm-моделиПолчаса назад вышла новость о выходе DeepSeek Janus-7B - новой мультимодальной модели от DeepSeek, которая, по заявлениям авторов, рвёт DALL-E 3, Stable Diffusion XL и Stable Diffusion 3 (Medium) в бенчмарках.
В этой статье я не буду дублировать новость, а хочу подробнее рассмотреть, что именно в этой модели такого уникального, из-за чего многие связанные с AI медиа сегодня захлебываются от восторга.
DeepSeek R1: LLM с открытым исходным кодом с производительностью наравне с моделью o1 от OpenAI
2025-01-27 в 18:01, admin, рубрики: AI, deepseek, DeepSeek R1, llm, ИИ
DeepSeek R1: модель с производительностью o1 от OpenAI. Сравнение с o1, сколько стоит и как использовать API
2025-01-27 в 18:01, admin, рубрики: AI, deepseek, DeepSeek R1, llm, ИИ
Кремниевая долина в восторге от китайской модели ИИ. Колонка WSJ о моделях DeepSeek
2025-01-27 в 14:23, admin, рубрики: AI, deepseek, llm, nlp, silicon valley, ИИ, искусственный интеллект, моделиDeepSeek называют «поразительной и впечатляющей», несмотря на использование менее совершенных чипов.
Китайская компания в сфере искусственного интеллекта заставила Кремниевую долину недоумевать, как её программистам удалось почти сравняться с американскими конкурентами, используя более слабые чипы.
DeepSeek — очередной квантовый скачок в развитии AI
2025-01-26 в 13:47, admin, рубрики: deepseek, llm, OpenAI深度求索, запомните эти слова.
Пока скептики в области ИИ продолжают размышлять о том, что ИИ никогда не обретет сознание и останется лишь имитатором интернета, небольшая китайская компания совершила прорыв. Они создали думающую Читать полностью »