Рубрика «llm» - 6

Сегодня мы попробуем сделать свой ИИ с телеграм ботом для возможности простого общения с ней. Сразу оговорюсь, мы не будем в очередной раз использовать открытый API ChatGPT или новомодного Deepseek. Мы развернем свой полноценный ИИ локально и сынтегрируем его с телеграм ботом.

LLM модель

Telegram бот + ИИ Jlama своими руками - 1

Читать полностью »

в 10:15, , рубрики: llm

Ни дня не проходит, чтобы не появилась какая‑нибудь статья об LLM. И каждый раз, читая их, мне, как старому деду, хочется воскликнуть: «Вы всё делаете неправильно! Какое принятие решений? Какие математические расчёты? А вот в pet проекте - ей самое место!»

Почти у каждого разработчика, который имеет хоть немного свободного времени, есть свои домашние проекты. Обычно они характеризуются малым временем на разработку, применением только для себя любимого или ближайшего круга лиц и большей лояльностью к защите от дурака.
Читать полностью »

В первой части статьи я рассказывала о том, как извлекала культурные реалии из субтитров фильмов. Теперь пришло время оптимизировать сам подход, скрипт и результаты анализа. В этот раз я обработала все четыре сезона любимого многими яркого и отдыхающего сериала Emily in Paris и узнала, например, что "hemorrhaging clients" — это отнюдь не "геморройные клиенты" и даже не клиенты с геморроем в медицинском смысле, а стремительная потеря клиентов (по аналогии с кровотечением, которое, как мы знаем, "hemorrhage" на английском). Узнала, что раскованные французы поднимают бокалы с возгласом Tchin-tchin!, Читать полностью »

DeepSeek-R1 — это самый громкий релиз последних дней в области искусственного интеллекта. Для сообщества исследователей и разработчиков машинного обучения (ML R&D) эта модель имеет особое значение по ряду причин:

  1. Модель обладает открытыми весами и включает уменьшенные, дистиллированные варианты.

  2. Она делится и размышляет над методом обучения, позволяющим воспроизвести модель рассуждений, подобную OpenAI O1.

В этой публикации мы рассмотрим, как была создана DeepSeek-R1.

Дисклеймер: это вольный перевод статьиЧитать полностью »

LLM – это, по сути, ChatGPT без интернета

LLM – это, по сути, ChatGPT без интернета

Несмотря на то, что искусственный интеллект только начал входить в нашу жизнь, он уже перестал быть привилегией супер-компьютеров и облачных платформ. Теперь даже не самые новые iPhone способны нативно запускать продвинутые языковые моделиЧитать полностью »

Полчаса назад вышла новость о выходе DeepSeek Janus-7B - новой мультимодальной модели от DeepSeek, которая, по заявлениям авторов, рвёт DALL-E 3, Stable Diffusion XL и Stable Diffusion 3 (Medium) в бенчмарках.

В этой статье я не буду дублировать новость, а хочу подробнее рассмотреть, что именно в этой модели такого уникального, из-за чего многие связанные с AI медиа сегодня захлебываются от восторга.

Читать полностью »
DeepSeek R1: LLM с открытым исходным кодом с производительностью наравне с моделью o1 от OpenAI

DeepSeek R1: LLM с открытым исходным кодом с производительностью наравне с моделью o1 от OpenAI

Читать полностью »

DeepSeek R1: LLM с открытым исходным кодом с производительностью наравне с моделью o1 от OpenAI

DeepSeek R1: LLM с открытым исходным кодом с производительностью наравне с моделью o1 от OpenAI

Читать полностью »

DeepSeek называют «поразительной и впечатляющей», несмотря на использование менее совершенных чипов.

Китайская компания в сфере искусственного интеллекта заставила Кремниевую долину недоумевать, как её программистам удалось почти сравняться с американскими конкурентами, используя более слабые чипы.

Читать полностью »

深度求索, запомните эти слова.

Пока скептики в области ИИ продолжают размышлять о том, что ИИ никогда не обретет сознание и останется лишь имитатором интернета, небольшая китайская компания совершила прорыв. Они создали думающую Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js