Итак, друзья, продолжаем тему прогнозирования временных рядов с помощью Chronos.
Напомню, что Chronos это фреймворк от компании Amazon — простой, но эффективный фрэймворк для предобученных вероятностных моделей временных рядов.
Итак, друзья, продолжаем тему прогнозирования временных рядов с помощью Chronos.
Напомню, что Chronos это фреймворк от компании Amazon — простой, но эффективный фрэймворк для предобученных вероятностных моделей временных рядов.
Вам не кажется, что у нас на глазах рождается новый вид социальной зависимости – зависимость от общения с ИИ?
Я наткнулась на статью, где рекламировался девайс с ИИ в виде амулета, который всегда с тобой и всегда ответит. Позиционировался как девайс для одиноких людей, чтобы закрывать проблему общения
В этой статье я рассказываю про основные концепции, типы обучения, типы задач в машинном обучении и также делаю постановку задачи машинного обучения (МО). Все это я рассказываю в своем стиле и понимании.
Разработчикам приложений Generative AI стоит обратить внимание на новую коллекцию моделей Qwen 2.5 и Qwen 2.5 Coder. С сентября 2024 года эти модели привлекают внимание разработчиков благодаря своей эффективности.
Эти модели созданы Alibaba Cloud и предлагают много полезных для AI-сообщества функций.
Во-первых, веса Qwen 2.5 доступны в версиях от 0.5B параметров — это очень легковесная модель — до 72B. Посередине есть 3, 7, 14 и 32B, каждую из которых вполне можно запускать локально, если у вас есть, например RTX 3080 с 16ГБ видеопамяти. В этом поможет квантизация (особенно в случае с 32B). Квантованные веса в форматах Читать полностью »
"Мы так боимся потерять человечность, что рискуем потерять будущее."
Странное время мы переживаем. Время, когда технологии развиваются экспоненциально, а человеческая природа остаётся неизменной. Время, когда мы способны создавать искусственный интеллект, но не можем справиться с собственными ограничениями. Время, когда мы стоим на пороге величайшей трансформации в истории человечества, но большинство предпочитает закрывать на это глаза.
Распознавание именованных сущностей (Named Entity Recognition, NER) — это одна из самых востребованных задач в обработке естественного языка (NLP). Чтобы создать качественную модель для NER, требуется тщательно размеченная обучающая выборка, а процесс её создания может занять много времени и ресурсов. В этой статье я расскажу о своём пути разметки данных, начиная с использования Open Source инструментов и переходя к Prodigy, профессиональному инструменту для создания обучающих наборов данных.
В чем секрет качественных данных и точной разметки? Мы в Data Light знаем: за каждым успешным проектом стоят не только технологии, но и люди — специалисты, отобранные после нескольких этапов тестирований и обученные на настоящих проектах.
В этой главе будут рассмотрены все необходимые аспекты для понимания механизмов работы CFG Scale, а также плюсы и минусы подхода с математическими примерами. Решил собрать все самое важное в одном месте без воды.
"Не верь снам, сны - обман."
Из письма Мари Мишон, адресованного Арамису.
Этот текст появился, по первоначальной задумке, как недлинный коммент к материалу Сны разума: что общего у сновидений с работой нейросетей? за авторством @popski_ruvds. А потом автору самодовольно пришло в голову, что поток рефлексий можно ведь попробовать сделать достойным и отдельной статьи-размышления... сказано - сделано. Сходу предвижу контраргумент "дурное дело нехитрое", ну да ладно.
Мы в лаборатории Fusion Brain уже много лет работаем на созданием мультимодальных моделей, способных работать с как можно большим числом данных разного типа. Не так давно, например, мы релизнули мультимодальную LLM OmniFusion 1.1, способную поддерживать визуальный диалог и отвечать на вопросы по картинкам, причём с поддержкой русского языка — и рассказали об этом на Хабре.