Рубрика «artificial intelligence»

За два десятилетия моей работы в этой сфере я никогда не был так зол на себя за пропущенную историю, как в пятницу, когда Apple объявила, что «более персонализированные функции Siri» в Apple Intelligence, которые должны были появиться в период до WWDC, будут отложены до «следующего года».

Мне следует проверить голову.

Читать полностью »

Часть 1: Методы масштабирования вычислительной мощности во время вывода

Улучшение способностей к рассуждению больших языковых моделей (LLM) стало одной из самых обсуждаемых тем в 2025 году – и не без оснований. Улучшенные навыки рассуждения позволяют моделям решать более сложные задачи, что делает их полезными в самых разных областях, интересных пользователям.

Читать полностью »

Как гонка за AI-талантами меняет рынок труда в сфере технологий - 1

От финансов до розничной торговли — компании всё чаще ищут специалистов с навыками работы в сфере искусственного интеллекта при найме сотрудников в области технологий.

Компании всё чаще задают потенциальным сотрудникам вопрос: «Вы умеете работать с ИИ?»

Читать полностью »

В эпоху, когда ИИ проникает в каждый сектор, понимание различий между AI Engineering и ML Engineering становится ключевым для выбора стратегии разработки. Книга AI Engineering: Building Applications with Foundation Models ярко иллюстрирует, как фундаментальные модели (foundation models) переворачивают традиционные подходы. Вот что важно знать.

Почему сегодня AI Engineering вытесняет ML Engineering?

  1. Демократизация доступа к ИИ

    Раньше: Создание ML‑моделей требовало месяцев работы с raw data, обучения архитектур и настройки гиперпараметров. Например, обучение GPT-3 потребовало 3,5 тыс. GPU‑лет.

    СейчасЧитать полностью »

Введение: Это не магия, это наука

Если вы когда-нибудь общались с ChatGPT и задавались вопросом, как он вообще понимает ваши слова, вы не одиноки. Это действительно может казаться магией. Вы пишете вопрос, и через мгновение — вуаля! — перед вами готовый ответ. Но будьте уверены, это не магия, а научные достижения, основанные на сложных технологиях. В этой статье мы разберем, как всё устроено. Вам не потребуется техническое образование, чтобы понять!

Содержание

Почему искусственный интеллект такой дорогой: пять причин от Bloomberg - 1

Стремление к созданию более масштабных моделей искусственного интеллекта, а также увеличение числа чипов и дата-центров для их разработки, оборачивается значительными расходами для технологических компаний.

Важное примечание
AI-first компании развиваются быстрее и действуют иначе. Перевод колонки издания WSJ - 1

В отличие от уже устоявшихся фирм, эти стартапы рассматривают искусственный интеллект как отправную точку. Большинство компаний вынуждены внедрять генеративный ИИ как дополнительное решение, но немало молодых предприятий изначально ставят ИИ во главу угла.

Читать полностью »

В рамках данной статьи мы обсудим новое zero-shot решение (то есть способное справляться с задачей без дополнительного обучения на данных из конкретного домена) задачи Visual Object Tracking под названием SAMURAI(SAM-based Unified and Robust zero-shot visual tracker with motion-Aware Instance-level memory). Эта модель продемонстрировала хороший перфоманс в задаче визуального трекинга, обойдя на нескольких бенчмарках своего прямого предка - SAM 2, а также многие supervised-решения(требующие дообучения под конкретный домен и задачу).

Читать полностью »

Сегодня мы попробуем сделать свой ИИ с телеграм ботом для возможности простого общения с ней. Сразу оговорюсь, мы не будем в очередной раз использовать открытый API ChatGPT или новомодного Deepseek. Мы развернем свой полноценный ИИ локально и сынтегрируем его с телеграм ботом.

LLM модель

Telegram бот + ИИ Jlama своими руками - 1

Читать полностью »

DeepSeek-R1 — это самый громкий релиз последних дней в области искусственного интеллекта. Для сообщества исследователей и разработчиков машинного обучения (ML R&D) эта модель имеет особое значение по ряду причин:

  1. Модель обладает открытыми весами и включает уменьшенные, дистиллированные варианты.

  2. Она делится и размышляет над методом обучения, позволяющим воспроизвести модель рассуждений, подобную OpenAI O1.

В этой публикации мы рассмотрим, как была создана DeepSeek-R1.

Дисклеймер: это вольный перевод статьиЧитать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js