Рубрика «ml»
Ускорение LLM: универсальные методы для популярных архитектур
2025-02-05 в 7:00, admin, рубрики: llm, ml, инференс, нейросетиРецензия на переводную книгу “Машинное обучение с малым объемом кодирования” (Low-Code AI)
2025-02-04 в 11:32, admin, рубрики: low-code, ml, sql, аналитик, аналитик данных, искусственный интеллект, книга по ML, книга по ИИ![Рецензия на переводную книгу “Машинное обучение с малым объемом кодирования” (Low-Code AI) - 1 Рецензия на переводную книгу “Машинное обучение с малым объемом кодирования” (Low-Code AI) - 1](https://www.pvsm.ru/images/2025/02/04/recenziya-na-perevodnuyu-knigu-mashinnoe-obuchenie-s-malym-obemom-kodirovaniya-Low-Code-AI.jpg)
Как кажется, основные читатели книги "Low-Code AI" Читать полностью »
Опять DeepSeek? Побудем в роли детектива
2025-02-04 в 10:37, admin, рубрики: AI, deepseek, DeepSeek R1, ml这篇帖子是用一碗米饭支付的,猫老婆
Хайп, хайп и еще раз хайп
Когда про DeepSeek-r1 начали говорить уже из каждого утюга, я долго думал, а стоит ли еще и свои 5 копеек вставлять в эту историю, и подумал, конечно же да! Ведь могу.
Применение ML для оптимизации работы питательных электронасосов в ТЭЦ металлургического комбината
2025-01-30 в 15:33, admin, рубрики: ml, python, автоматизация, автоматизация предприятий, искусственный интеллект, машинное обучение, машинное обучение. нейросети, машинное обучение. нейросети python, Программирование, промышленная автоматизацияСегментация изображений с дефектами для промышленности на основе Unet и TensorFlow
2025-01-25 в 5:07, admin, рубрики: DS, Hackathon, ml, TensorFlowВведение
Недавно я и моя команда участвовали в хакатоне от компании «Норникель». Мы выбрали трек «Грязные дела», где наша задача заключалась в разработке алгоритма компьютерного зрения для решения проблем на производстве.
Задача заключалась в решении проблемы загрязнения линз камер на производстве. Из-за этого алгоритмы компьютерного зрения теряли свою точность, что сказывалось на производительности. Нужно было разработать эффективный алгоритм для сегментации дефектов с минимальными затратами ресурсов и времени.
Security-RAG или как сделать AI Security tool на коленке
2025-01-20 в 6:11, admin, рубрики: chromadb, LangChain, langfuse, llm, llm-attack, llm-приложения, ml, искусственный интеллект, промпт-инъекцииЗатравочка
LLM-ки и LLM-агенты продолжают наводить шум. статьи про то как сделать очередной RAG или Агента продолжают клепаться (да блин даже мы одна из этих статей), huggingface выпускают smolagents, квантизация позволяет дойти LLM-кам до простых работяг и обывателей, давая им возможность в них потыкаться в той же LM studio или других приложениях.
Нейросети vs Stack Overflow: что происходит?
2025-01-12 в 9:38, admin, рубрики: ml, OpenAI, selectel, stack overflow, машинное обучение, нейросети![Нейросети vs Stack Overflow: что происходит? - 1 Нейросети vs Stack Overflow: что происходит? - 1](https://www.pvsm.ru/images/2025/01/13/neiroseti-vs-Stack-Overflow-chto-proishodit.jpg)
Источник изображения: ai.plainenglish.io
Stack Overflow, о котором, вероятно, знают на Хабре все, сейчас проигрывает неожиданному конкуренту — нейросетям. Пессимисты даже считают, что может завершиться без малого 20-летняя история проекта. Проблема в том, что все больше разработчиков предпочитают задавать свои вопросы не людям, а искусственному интеллекту. Так быстрее и во многих случаях эффективнее. Давайте разберемся, что там происходит.
Читать полностью »
Как банки предсказывают кредитные риски: опыт создания PD-моделей из ФинТеха
2025-01-08 в 16:23, admin, рубрики: Application PD, Behavioral PD, ml, классификация, Оценка вероятностей, риски, скоринг, финтехПредставьте, что вы управляете кредитным портфелем банка: каждый выданный кредит – это ставка на то, что клиент выполнит свои обязательства. Как понять, кто из заемщиков надежен, а кто может не справиться с платежами? Здесь на помощь приходят Probability of Default (PD) модели.
PD-модели – это инструменты, используемые в банковском секторе для оценки вероятности дефолта заемщика в течение определенного периода времени. Они играют важную роль в управлении рисками и кредитной политике банка.
Алгоритмы спекулятивного инференса LLM
2025-01-05 в 9:25, admin, рубрики: DL, DL инференс, llm, ml, ML алгоритмы, алгоритмическая оптимизация, инференс, оптимизация инференса, спекулятивный декодингВведение
За последние годы качество LLM моделей сильно выросло, методы квантизации стали лучше, а видеокарты мощнее. Тем не менее качество генерации все еще напрямую зависит от размера весов и, как следствие, вычислительной сложности.
Кроме того, генерация текста авторегрессионна - токен за токеном по одному, потому ее сложность зависит от размера контекста и количества генерируемых токенов.
Но генерация текста не всегда имеет однородную сложность, так же как мы во многом мыслим идеями, а слова произносим “на автомате”. В статье обсудим алгоритмы, позволяющие использовать эту неоднородность для ускорения.
Читать полностью »
Почему OpenAI откладывает релиз ChatGPT-5? Все дело в недостатке данных
2025-01-04 в 9:10, admin, рубрики: AI, llm, ml, nlp, OpenAI, ИИ, искусственный интеллект, нейросети![Почему OpenAI откладывает релиз ChatGPT-5? Все дело в недостатке данных - 1 Почему OpenAI откладывает релиз ChatGPT-5? Все дело в недостатке данных - 1](https://www.pvsm.ru/images/2025/01/04/pochemu-OpenAI-otkladyvaet-reliz-ChatGPT-5-vse-delo-v-nedostatke-dannyh.png)
Новый проект OpenAI в области искусственного интеллекта, получивший кодовое название Orion, столкнулся с множеством проблем. Он отстает от графика и требует огромных затрат. Неясно, когда и будет ли он работать. Возможно, в мире недостаточно данных, чтобы сделать его достаточно умным.
Дисклеймер: это вольный перевод Читать полностью »