Распознавание именованных сущностей (Named Entity Recognition, NER) — это одна из самых востребованных задач в обработке естественного языка (NLP). Чтобы создать качественную модель для NER, требуется тщательно размеченная обучающая выборка, а процесс её создания может занять много времени и ресурсов. В этой статье я расскажу о своём пути разметки данных, начиная с использования Open Source инструментов и переходя к Prodigy, профессиональному инструменту для создания обучающих наборов данных.
Рубрика «artificial intelligence» - 3
Путь разметки данных для NER: от Open Source до Prodigy
2024-11-09 в 20:15, admin, рубрики: annotation processing, artificial intelligence, named entity recognition, natural language processing, prodigy, spacy, искусственный интеллект, машинное обучениеКак мы отбираем и обучаем разметчиков: от первых шагов до реальных проектов
2024-10-25 в 9:02, admin, рубрики: artificial intelligence, big data, data annotation, project management, аннотация, разметка данных, разметка датасета
В чем секрет качественных данных и точной разметки? Мы в Data Light знаем: за каждым успешным проектом стоят не только технологии, но и люди — специалисты, отобранные после нескольких этапов тестирований и обученные на настоящих проектах.
Продолжение статьи про CFG Scale | математика, плюсы и минусы метода
2024-09-24 в 14:52, admin, рубрики: AI, artificial intelligence, cfg, cfg scale, flux, GAN, stable, ИИ, искусственный интеллект, нейросети
В этой главе будут рассмотрены все необходимые аспекты для понимания механизмов работы CFG Scale, а также плюсы и минусы подхода с математическими примерами. Решил собрать все самое важное в одном месте без воды.
Тень, знай свое место. Даже если ты нейросеть
2024-09-21 в 22:08, admin, рубрики: artificial intelligence, neural networks, атеизм, бессознательное, нейронные сети, психиатрия, психология, сны"Не верь снам, сны - обман."
Из письма Мари Мишон, адресованного Арамису.
Этот текст появился, по первоначальной задумке, как недлинный коммент к материалу Сны разума: что общего у сновидений с работой нейросетей? за авторством @popski_ruvds. А потом автору самодовольно пришло в голову, что поток рефлексий можно ведь попробовать сделать достойным и отдельной статьи-размышления... сказано - сделано. Сходу предвижу контраргумент "дурное дело нехитрое", ну да ладно.
Эмоциональный и искусственный. Учим нейросети понимать социальные взаимодействия людей на AIJ Contest
2024-09-17 в 11:56, admin, рубрики: artificial intelligence, natural language processing, большие языковые модели, мультимодальные модели, соревнования, хакатон, ХакатоныМы в лаборатории Fusion Brain уже много лет работаем на созданием мультимодальных моделей, способных работать с как можно большим числом данных разного типа. Не так давно, например, мы релизнули мультимодальную LLM OmniFusion 1.1, способную поддерживать визуальный диалог и отвечать на вопросы по картинкам, причём с поддержкой русского языка — и рассказали об этом на Хабре.
«Окно» в LLM: как компании из России найти безопасную альтернативу ChatGPT
2024-08-22 в 12:07, admin, рубрики: AI, api, artificial intelligence, chatgpt, ИИ, искусственный интеллект, маскирование данных, облачные сервисыПривет! Меня зовут Петр Мицов, я продакт-менеджер в Just AI. Одно из ключевых направлений нашей компании — разработка решений на базе генеративного AI для бизнеса.
StableProjectorz — бесплатный инструмент для текстурирования 3D-моделей с помощью нейросетей
2024-06-16 в 5:32, admin, рубрики: artificial intelligence, stablediffusion, игры, ИИ, моделирование, юнитиПривет! Хочу поделиться с вами своей разработкой - программой StableProjectorz, которая поможет упростить и ускорить создание текстур для ваших 3D-моделей с использованием нейросетей.

Что из себя представляет StableProjectorz:
Шесть экспериментов с нейросетями — от Midjourney до Notion AI
2023-04-05 в 14:30, admin, рубрики: artificial intelligence, dalle-2, midjourney, notion ai, selectel, stable diffusion, Блог компании Selectel, будущее здесь, искусственный интеллект, машинное обучение, Научно-популярное, подборка
На Хабре много обзоров нейросетей вроде Midjourney и ChatGPT. Мы пошли дальше и поэкспериментировали с ними: устроили им краш-тест, сравнили между собой и испытали их на нетипичных задачках. В подборке собрали самые интересные результаты. Сохраняйте статью в закладки и пишите в комментариях, какие эксперименты хотели бы увидеть в нашем блоге.
Читать полностью »
Программы пишут программы, или стоит ли разработчикам осваивать новые профессии
2023-02-19 в 15:54, admin, рубрики: artificial intelligence, chatgpt, OpenAI, искусственный интеллект, нейронные сети, Программирование, разработкаПосле выхода ChatGPT только ленивый не написал о нём. Языковая модель GPT-3.5 от OpenAI привлекла широкое внимание общественности своими возможностями: создание текстов, возможности перевода, получения точных ответов и использования контекста для диалога. Но больше всего разработчиков впечатлила возможность написания работающего кода по запросу на естественном языке.
Работа в Data Science: что важно знать и как этому научиться
2022-05-29 в 18:30, admin, рубрики: artificial intelligence, big data, career, data science, machine learning, self-education, искусственный интеллект, Карьера в IT-индустрии, машинное обучениеО чем это все?
Сегодня словосочетания вроде Data Science, Machine Learning, Artificial Intelligence очень популярны. При этом нередко под ними понимаются довольно разные вещи. Это зачастую смущает и запутывает людей, желающих войти в специальность: трудно разобраться, с чего начать, что действительно нужно, а что необязательно для начала. Не претендуя на общность, расскажем, как это видится на основе десятка лет опыта c решением такого рода задач для крупных клиентов со всего мира (сервис / заказная разработка / аутсорс – подставьте термин по вкусу).