Главная

Рубрика «llama»

На сколько Ollama готова для Production?

2025-03-23 в 18:53, admin, рубрики: gguf, gpt, huggingface, javascript, llama, llm, Ollama, python, TypeScript, yandexgpt

Некоторое время назад я был в восторге от Ollama: простое скачивание моделей одной консольной командой, наличие SDK для NodeJS и Python, OpenAI-подобное API. Однако, так как отрасль рынка активно развивается, инструмент с каждым днем становится менее конкурентноспособным

Проблемы Ollama

Пункты ниже заставят вас задуматься рассмотреть другой инструмент запуска GGUF, например: LMStudio, LocalAI, KoboldCPP, vLLM или llama-server

Модели-шизофреники c тысячами загрузок

Читать полностью »

Комплексное руководство по конфигурации сервера для LLM

2025-03-17 в 15:15, admin, рубрики: llama, llm, llm-модели, сервер

Привет! Развертывание языковой модели на собственном сервере требует тщательного планирования аппаратной составляющей. В этой статье мы разберем, какие компоненты критически важны для эффективной работы LLM, как они взаимодействуют, и какую конфигурацию выбрать под разные сценарии использования.

Читать полностью »

Телеграм-бот с ИИ Jlama: добавляем новые фичи

2025-02-11 в 15:13, admin, рубрики: AI, java, llama, llm, spring, telegram, искусственный интеллект

Привет! В прошлый раз мы сделали телеграм-бота с полноценным ИИ. Теперь мы продолжим добавлять новые интересные фичи нашему боту, но в этот раз мы начнем с конца и посмотрим на готовый результат, а потом разберем код и детали реализации.

Дэмо

Первое, что мы сделаем – это добавим небольшое меню с двумя опциями: выбор модели ИИ и отображение уже выбранной модели.

Читать полностью »

Отчёт о запуске DeepSeek-R1 на Xeon 6132 c 768 ГБ памяти

2025-02-06 в 14:19, admin, рубрики: deepseek, llama

Спойлер для экономии времени читающих — я просто скачаю DeepSeek и запущу его через llama.cpp, на какую-либо научную новизну этот пост совершенно не претендует. Зачем это на хабре, если там всего одна команда? Просто в комментариях к посту «Мануал по запуску полной модели DeepSeek-R1 локально Читать полностью »

Альтернативы ChatGPT на смартфонах без интернета: как установить и использовать локальные языковые модели на iPhone

2025-01-28 в 9:28, admin, рубрики: gpt, llama, llm, xcom-shop

LLM – это, по сути, ChatGPT без интернета

Несмотря на то, что искусственный интеллект только начал входить в нашу жизнь, он уже перестал быть привилегией супер-компьютеров и облачных платформ. Теперь даже не самые новые iPhone способны нативно запускать продвинутые языковые моделиЧитать полностью »

Почему DeepSeek способен конкурировать с OpenAI и как повторить их опыт

2025-01-28 в 8:10, admin, рубрики: AI, chatgpt, deepseek, llama, OpenAI, ИИ, языковая модель, языковые модели

За последние два года - за время невероятной популярности Generative AI - появилось много перспективных компаний, создающих новые прорывные модели. Последний пример - это китайский стартап DeepSeek, благодаря которому у нас есть открытые аналоги OpenAI GPT-4o и o1. С теми же (что проверено бенчмарками) возможностями в плане выполнения текстовых инструкций, задач на математику, логику и кодинг.

Читать полностью »

Современные протоколы кредитования в DeFi: как это работает— Curve LlamaLend

2025-01-02 в 11:18, admin, рубрики: curve, DeFi, lending protocol, llama

Введение

В этой статье мы рассмотрим протокол кредитования — Curve LlamaLend. Это уникальный проект, основанный на стейблкоине CrvUSD и использующий автоматизированного маркет-мейкера (AMM) в своей основе. У CrvUSD есть несколько интересных особенностей, таких как математическая модель для управления стабильностью курса и механизмы стабилизации, которые работают с ценовыми диапазонами. Эти диапазоны чем-то напоминают «тики» из Uniswap V3, но функционируют иначе. Ещё одна необычная деталь — так называемые «мягкие ликвидации». Они работают совершенно не так, как стандартные ликвидации в других протоколах.
Читать полностью »

Сможет ли ИИ принять правильное решение? Ответы нейросетей на моральные вызовы

2024-12-11 в 13:31, admin, рубрики: gemini, GigaChat, gpt, llama, llm, qwen, yandexgpt, искусственный интеллект

Читать полностью »

Почему LLM так плохо играют в шахматы (и что с этим делать)

2024-11-29 в 10:10, admin, рубрики: gpt 3.5-turbo, gpt 4.0, gpt-4 omni, gpt-4o, llama, llama 3.1, llm, большие языковые модели, шахматы

В своём последнем посте я говорил об одной загадке: все большие языковые модели (LLM) ужасно играют в шахматы. Все, за исключением gpt-3.5-turbo-instructЧитать полностью »

Мы потратили 320 тысяч рублей ради Nvlink для нейросетей. Но был ли в этом смысл?

2024-11-25 в 10:53, admin, рубрики: A5000, llama, Nvidia, NVLink, ServerFlow, Видеокарты, ИИ, искуственный интеллект, машинное обучение, Серверное администрирование

Привет, с вами снова ServerFlow. И да, мы потратили 320 тысяч рублей, чтобы проверить, есть ли какой-то толк от Nvlink при развертывания нейросетей? Тесты мы провели на двух видеокартах Nvidia A5000 24GB, сначала объединённые NVLink, а после без него. Для наглядности теста нами была выбрана последняя языковая модель LLaMA 3.2 на 90 миллиардов параметров. Что у нас в итоге вышло – сможете узнать ниже в посте.

Читать полностью »

Публикации RSS | Комментарии RSS

https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js

Информация

Обсуждаемое

Рекомендуем

Рубрика «llama»

На сколько Ollama готова для Production?

Проблемы Ollama

Комплексное руководство по конфигурации сервера для LLM

Телеграм-бот с ИИ Jlama: добавляем новые фичи

Дэмо

Отчёт о запуске DeepSeek-R1 на Xeon 6132 c 768 ГБ памяти

Альтернативы ChatGPT на смартфонах без интернета: как установить и использовать локальные языковые модели на iPhone

Почему DeepSeek способен конкурировать с OpenAI и как повторить их опыт

Современные протоколы кредитования в DeFi: как это работает— Curve LlamaLend

Введение

Сможет ли ИИ принять правильное решение? Ответы нейросетей на моральные вызовы

Почему LLM так плохо играют в шахматы (и что с этим делать)

Мы потратили 320 тысяч рублей ради Nvlink для нейросетей. Но был ли в этом смысл?

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «llama»

Проблемы Ollama

Дэмо

Введение

Новости

Актуальные темы

Архив