Рубрика «natural language processing»
Применение методов обработки естественного языка и больших языковых моделей в области открытия новых материалов
2025-03-24 в 14:10, admin, рубрики: gpt, llm, natural language processing, natural language understanding, nlp, nlu, материаловедениеСэм Альтман знает, как достичь AGI. Я тоже, и сейчас расскажу как
2025-01-14 в 4:13, admin, рубрики: AGI, AI, artificial intelligence, gpt, natural language processing, OpenAI, генеративные модели, искусственный интеллект, машинное обучение, нейросети«Теперь мы уверены, что знаем, как построить AGI в том виде, в каком мы традиционно его понимали… Сейчас это звучит как научная фантастика, и даже говорить об этом как-то безумно. Все в порядке — мы уже были там раньше и не против оказаться там снова.»
Такой пост 6 января Альтман опубликовал в своем блоге. Интересно, что перед этим он даже сказал, что AGI будет при Трампе, то есть до января 2029 года. Может показаться, что он готовится к очередному раунду приема пожертвований на GPU, и это приглашение сделать пожертвование побольше. Я уверен, что это не так.
Задача Emotional FusionBrain 4.0: итоги и победители
2024-12-10 в 13:33, admin, рубрики: artificial intelligence, deeplearning, natural language processing, большие языковые модели, мультимодальные данные, мультимодальные модели, Сбер, соревнования, хакатон, ХакатоныВсем привет! На связи снова лаборатория FusionBrain!
В сентябре мы анонсировали задачу Emotional FusionBrain 4.0, которая стала частью соревнования AI Journey Contest. Участникам предстояло разработать универсальную мультимодальную модель, которая учится понимать социальные взаимодействия людей по видео — другими словами, создать эмоциональный искусственный интеллект.
Теперь пришла пора подводить итоги!
Но начнём мы, конечно же, с описания задачи, чтобы уважаемые читатели оказались в едином контексте :)
NLP: когда машины начинают понимать нас (Часть 3)
2024-12-09 в 6:00, admin, рубрики: keras, machine learning, natural language processing, nlp, python, pytorch, TensorFlow, искусственный интеллект, машинное обучение, обработка естественного языка1. Введение
В предыдущих статьях мы рассмотрели теоретические основы NLP, включая базовые понятия, такие как токенизация, стемминг, лемматизация и другие. Мы также поработали с библиотеками NLTK и spaCy и выполнили простые задания по обработке текста.
В этой статье мы продолжим изучение NLP и перейдем к более продвинутым темам, которые являются главными для построения современных приложений и моделей в области обработки естественного языка. А также создадим и обучим модели самостоятельно, используя TensorFlow/Keras и PyTorch.
NLP: когда машины начинают понимать нас (Часть 2)
2024-12-08 в 6:30, admin, рубрики: machine learning, natural language processing, nlp, NLTK, python, spacy, искусственный интеллект, машинное обучение, обработка естественного языка, пайтон1. Введение
В прошлой статье мы с вами изучили теоретические основы обработки естественного языка (NLP) и теперь готовы перейти к практике. В мире NLP выбор подходящего языка программирования и инструментов играет ключевую роль в успешной реализации проектов. Одним из наиболее популярных языков для решения задач в этой области является Python. Его простота, читаемость и поддержка мощных библиотек делают его идеальным выбором для разработчиков.
NLP: когда машины начинают понимать нас (Часть 1)
2024-12-07 в 7:00, admin, рубрики: machinelearning, ml, natural language processing, nlp, машинное обучение, обработка естественного языкаВведение в NLP
Представьте, что вы можете разговаривать с компьютером так же естественно, как с обычным человеком. Вы задаёте вопросы, получаете ответы, даёте команды - и это всё на вашем родном языке. Именно этим и занимается обработка естественного языка (Natural Language Proccessing, или NLP) - область искусственного интеллекта, которая фокусируется на взаимодействии между компьютерами и людьми с помощью естественного языка.
Chronos от Amazon: революция в обработке временных рядов. Часть 2
2024-12-06 в 6:00, admin, рубрики: artificial intelligence, Chronos, data science, llm, machine learning, natural language processing, time series, временные ряды, искусственный интеллект, машинное обучениеИтак, друзья, продолжаем тему прогнозирования временных рядов с помощью Chronos.
Напомню, что Chronos это фреймворк от компании Amazon — простой, но эффективный фрэймворк для предобученных вероятностных моделей временных рядов.
Как мы помогли сырьевой госкомпании ускорить и упростить подбор подрядчиков с помощью LLM
2024-12-02 в 14:43, admin, рубрики: llm, natural language processing, автоматизация, автоматизация бизнес-процессов, автоматизация бизнеса, автоматизация бизнеса заказчиков, большие языковые модели, искусственный интеллект, машинное обучениеПривет! Меня зовут Кирилл Воронин, я data scientist в Doubletapp. В статье расскажу вам, как мы автоматизировали рутинные процессы отсмотра и сверки документов для допуска подрядчиков к тендерам.

Hippo-RAG: Долговременная память для LLM, вдохновленная нейробиологией
2024-11-22 в 5:00, admin, рубрики: llm, machine learning, natural language processing, rag, retrieval, retrieval augmented generation, transformer, TransformersУченые часто вдохновляется нашими или животными биологическими структурами: CNN, MLP, Backprop, и для многих других исследований можно найти сходства в реальном мире. Недавно вышла статья, которая делает то же самое, но для RAG (Retrieval-Augmented Generation). В некотором роде, это недостающая современным LLM долгосрочная память. Это понятно, а причем тут неокортекст, гиппокамп и другие сложные слова? Давайте посмотрим.
Путь разметки данных для NER: от Open Source до Prodigy
2024-11-09 в 20:15, admin, рубрики: annotation processing, artificial intelligence, named entity recognition, natural language processing, prodigy, spacy, искусственный интеллект, машинное обучениеРаспознавание именованных сущностей (Named Entity Recognition, NER) — это одна из самых востребованных задач в обработке естественного языка (NLP). Чтобы создать качественную модель для NER, требуется тщательно размеченная обучающая выборка, а процесс её создания может занять много времени и ресурсов. В этой статье я расскажу о своём пути разметки данных, начиная с использования Open Source инструментов и переходя к Prodigy, профессиональному инструменту для создания обучающих наборов данных.