На сколько Ollama готова для Production?

Некоторое время назад я был в восторге от Ollama: простое скачивание моделей одной консольной командой, наличие SDK для NodeJS и Python, OpenAI-подобное API. Однако, так как отрасль рынка активно развивается, инструмент с каждым днем становится менее конкурентноспособным

Проблемы Ollama

Пункты ниже заставят вас задуматься рассмотреть другой инструмент запуска GGUF, например: LMStudio ^[1], LocalAI ^[2], KoboldCPP ^[3], vLLM ^[4] или llama-server ^[5]

Модели-шизофреники c тысячами загрузок

https://ollama.com/hengwen/watt-tool-8B ^[6]

_{В рейтинге}_{Berkeley Function-Calling Leaderboard} ^[7]_модель_{watt-ai/watt-tool} ^[8]_{это топ по вызову инструментов, который обходит даже OpenAI. Что залито в репо Ollama не понятно, не вывозит даже слова "Привет", одну тысячу человек развели на 5ГБ трафика. К слову, генерация зациклилась: модель будет нести бред до посинения, пока вы сами не нажмете Ctrl + C}

Три релиза подряд Gemma3 падает из-за нестабильного планировщика памяти

Fixed issues where gemma3 would crash with "out of memory (OOM)" errors by improving memory estimation

_{Для пользователей мобильного интернета, крайне неудобная особенность: чтобы оперативно запустить поддержку Gemma, Ollama три недели подряд заливала спамящие нестабильные релизы. Каждый релиз весит от 600МБ до 1ГБ}
Поддержка инструментов всеми моделями библиотеки Ollama нестабильна

Если в модели не работают tool calling - это ваша проблема

_{У Ollama свой язык для объявления system prompt для моделей:}_Modelfile ^[9]_{. На текущий момент он не стабилен. Как следствие,}_{у моделей nemotron-mini и qwen2} ^[10]_{шилдик tools есть, а инструменты не работают. Там, где после патча Modelfile инструменты таки заработали,}_{они работают раз от раза} ^[11]
Открытый обман в официальных заявлениях

Посмотрите внимательно на архитектуру модели

_{В репо Ollama есть}_Deepseek-R1_{. Однако, это вовсе не DeepSeek, а обычная LLama 3.1, обученная на его дистиляции. Была использована}_{эта модель из HuggingFace} ^[12]_{. Как следствие, если запрос на русском к модели содержит англицизм, например,}_{Расскажи мне о work-life balance для программистов при выгорании}_{, модель}_{частично пишет ответ на русском, частично на английском} ^[13]
Некорректные Modelfile, которые пишет сама Ollama

Перечисление списка инструментов через python скрипт в Modelfile просто не работает. Совсем.

_{Некоторое время назад попытался скачать}_CommandR ^[14]_{из репо Ollama.}_{Модель весит 19ГБ}_{, со слов производителя, специально заточена под вызов инструментов. На момент публикации Modelfile не умел давать модели список инструментов, в итоге}_{CommandR не командует(}_{. Новые модели вообще публикуют без поддержки tool calls вовсе}

Спасибо за внимание!

Предлагаю обсудить изложенные выше пункты в комментариях на предмет предвзятости автора

Автор: tripolskypetr

Источник ^[15]

Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/javascript/414466

Ссылки в тексте:

[1] LMStudio: https://lmstudio.ai/

[2] LocalAI: https://localai.io/

[3] KoboldCPP: https://github.com/LostRuins/koboldcpp

[4] vLLM: https://pypi.org/project/vllm/

[5] llama-server: https://github.com/ggml-org/llama.cpp/issues/9291

[6] https://ollama.com/hengwen/watt-tool-8B: https://ollama.com/hengwen/watt-tool-8B

[7] _{Berkeley Function-Calling Leaderboard}: https://gorilla.cs.berkeley.edu/leaderboard.html?ref=cohere-ai.ghost.io

[8] _{watt-ai/watt-tool}: https://huggingface.co/watt-ai/watt-tool-70B

[9] _Modelfile: https://github.com/ollama/ollama/blob/b901a712c6b0afe88aef7e5318f193d5b889cf34/docs/modelfile.md

[10] _{у моделей nemotron-mini и qwen2}: https://github.com/ollama/ollama/issues/8287

[11] _{они работают раз от раза}: https://github.com/ollama/ollama/issues/9680#issuecomment-2746103757

[12] _{эта модель из HuggingFace}: https://huggingface.co/deepseek-ai/DeepSeek-R1-Distill-Llama-8B

[13] _{частично пишет ответ на русском, частично на английском}: https://habr.com/ru/articles/892468/

[14] _CommandR: https://ollama.com/library/command-r/blobs/922095537bc1

[15] Источник: https://habr.com/ru/articles/893624/?utm_campaign=893624&utm_source=habrahabr&utm_medium=rss

Нажмите здесь для печати.