Современные большие языковые модели (LLM) — ChatGPT, Gemini, DeepSeek, Qwen — из экзотического инструмента превратились в повседневную рабочую среду для многих специалистов. Мы используем их для написания кода, анализа данных и генерации текстов, часто подходя к процессу по наитию: подбираем промпты (запросы к GPT), меняем формулировки и сохраняем удачные как рецепты.
Рубрика «Семантика»
Математика смыслов: как слова становятся векторами в мире GPT
2025-09-18 в 7:31, admin, рубрики: AI, gpt, математика, основания промптинга, промптинг, СемантикаФрактальная логика и битва нейросетей за семантику
2025-08-26 в 6:55, admin, рубрики: логика, логические схемы, мандельброт, парадокс, парадоксы, Семантика, фракталы, фрактальная геометрия природы, фрактальные алгоритмы, фрактальные свойстваАналогии между фракталами и парадоксами
В 90-е годы резко вошла в моду фрактальная геометрия — учение Бенуа Мандельброта о том, что Евклид ошибся, детей в школе учат неправильно, а все формы в мире являюся «на самом деле» не точками, линиями и плоскостями, а фракталами. Природа фрактальна, мысль фрактальна, изображения фрактальны, звуки фрактальны. Весь мир фрактал и люди в нем фракталы (за очень редкими исключениями).
Эта идея меня увлекла, и поэтому, когда я учился на кафедре логики в МГУ, я решил написать диплом о фракталах и придумать фрактальную логику (кафедра логики всё‑таки).
Почему ИИ не понимает смысла, но этого (пока) хватает
2025-06-24 в 9:29, admin, рубрики: ИИ, ИИ и машинное обучение, интерпретируемость ии, когнитивные науки, нейросети, Семантика, Философия ИИХайп? Философия? Повседневность? Будущее?
Давайте разбираться.
TL;DR:
Онтология в IT - это способ структурировать знания о мире в виде связанных категорий и их свойств.
Например, в онтологии "Игры престолов" есть категории "дома", "персонажи" и связи между ними. Когда мы наполняем онтологию реальными данными, получается граф знаний.
Семантический слой - это более абстрактное понятие, включающее все способы придания смысла данным.
Вместе они помогают ИИ-системам лучше понимать контекст и давать более точные ответы.
Память, мозг, речь. Как мы понимаем местоимения?
2024-10-01 в 20:08, admin, рубрики: ассоциации, гиппокамп, коммуникация, общение, память, речь, Семантика, смыслыКогда речь заходит про общение и память, то наука в целом объясняет природу абстрактных образов, которыми мы обмениваемся друг с другом. Когда в голове всплывает образ «ручки» или «ноутбука», то это благодаря отдельным соединениям нейронов, нейронным связям. Но как реагирует наш мозг, когда речь заходит про местоимения? Как мы понимаем их смысл?

Зализняк: основа русской прикладной лингвистики
2023-07-21 в 9:36, admin, рубрики: Блог компании МойОфис, зализняк а.а., мойофис, морфологический словарь, морфология, поисковые системы, поисковые технологии, Семантика, Читальный зал
При построении прикладных систем, работающих с текстами, первая же задача — это отождествление слов друг с другом. Для большинства языков индо-европейской группы её решение не представляет большой сложности. И решений этих существуют сотни, а самые простые из них, как правило, дают вполне пригодные (в рамках решаемой задачи) результаты.
Тексты и надписи. Что не так с тёмной темой
2023-06-27 в 9:06, admin, рубрики: GUI, usability, здоровье, зрение, интерфейсы, Научно-популярное, Семантика, тёмная темаСовсем недавно мне стали попадаться на Хабре интересные и без преувеличения фундаментальные исследования о роли тёмной темы при проектировании GUI. Особенно отмечу публикацию уважаемой Марии Колчановой @mkolchanova «Как работают глаза и что надо учитывать, создавая тёмную тему приложенияЧитать полностью »
Первый нейросетевой переводчик для эрзянского языка
2022-10-09 в 10:00, admin, рубрики: cезон data mining, data mining, lower-resource language, machine learning, machine translation, ml, natural language processing, nlp, искусственный интеллект, малоресурсный язык, машинное обучение, машинный перевод, переводчик, СемантикаЭрзянский язык из финно-угорской семьи – один из официальных в республике Мордовия, и на нём говорят сотни тысяч людей, но для него до сих пор не было почти никаких технологий машинного перевода, кроме простых словарей. Я попробовал создать первую нейросеть, способную переводить с эрзянского на русский (и с натяжкой ещё на 10 языков) и обратно не только слова, но и целые предложения.
Пока её качество оставляет желать лучшего, но пробовать пользоваться уже можно.
Как я собирал для этого тексты и обучал модели – под катом.
Рейтинг русскоязычных энкодеров предложений
2022-06-05 в 19:18, admin, рубрики: BERT, natural language processing, python, sentence encoder, бенчмаркинг, машинное обучение, Семантика, энкодер предложенийЭнкодер предложений (sentence encoder) – это модель, которая сопоставляет коротким текстам векторы в многомерном пространстве, причём так, что у текстов, похожих по смыслу, и векторы тоже похожи. Обычно для этой цели используются нейросети, а полученные векторы называются эмбеддингами. Они полезны для кучи задач, например, few-shot классификации текстов, семантического поиска, или оценки качества перефразирования.
Нейросети для Natural Language Inference: логические умозаключения на русском языке
2021-10-10 в 12:35, admin, рубрики: BERT, natural language inference, natural language processing, natural language understanding, nli, nlp, nlu, python, Transformers, zero-shot classification, машинное обучение, обработка естественного языка, Программирование, СемантикаNLI (natural language inference) – это задача автоматического определения логической связи между текстами. Обычно она формулируется так: для двух утверждений A и B надо выяснить, следует ли B из A. Эта задача сложная, потому что она требует хорошо понимать смысл текстов. Эта задача полезная, потому что "понимательную" способность модели можно эксплуатировать для прикладных задач типа классификации текстов. Иногда такая классификация неплохо работает даже без обучающей выборки!
До сих пор в открытом доступе не было нейросетей, специализированных на задаче NLI для русского языка, но теперь я обучил целых три: Читать полностью »

