Привет! На связи Алексей Парфентьев, я в «СёрчИнформ» заведую инновациями и аналитикой. Каждый год мы изучаем, чем и как защищают данные российские компании (кстати, недавно делились первыми результатами этого года). Увидели, что доля внедрения DCAP-решений с 2021 года выросла почти в 10 раз (с 2,5% до 21%). Эта цифра меня зацепила – и вот я тут.
Рубрика «классификация текстов»
Ваша DCAP не справляется: еще раз об идеальных vs достижимых требованиях к системе файлового аудита
2024-12-10 в 9:14, admin, рубрики: DCAP, аудит файловой системы, защита данных, ИБ, классификация текстов, ограничение доступа к информации, СёрчИнформКак машинное обучение помогает проекту «ЗабастКом» освещать трудовые конфликты
2023-01-16 в 9:14, admin, рубрики: diy или сделай сам, IT в НКО, nlp, nlp (natural language processing), Алгоритмы, Блог компании Open Data Science, искусственный интеллект, классификация текстов, НКО, Новости, новостной агрегатор, общество, общество и IT, текстовая аналитика
В посте расскажу о моем успешном взаимодействии с некоммерческим проектом ЗабастКом, который поддерживает наемных работников в отстаивании своих трудовых прав и интересов. Моя цель была реализовать что-то похожее на ML4SG проект, где волонтеры-специалисты по анализу данных направляют свою энергию на пользу обществу. Например, применяют алгоритмы искусственного интеллекта для спасения потерявшихся людей, для мониторинга качества воздуха или для анализа новостного потока.
Для Забасткома получилось улучшить систему автоматической обработки новостей с помощью алгоритмов машинного обучения. Это привело к увеличению охвата важных событий и уменьшению ручного труда редакторов. Добавлю, что работа с ребятами была похожа на мечту любого DS специалиста: "заказчик" легко шел на контакт; присутствовала заинтересованность и неплохое понимание ML алгоритмов; некоторая продакшн-система уже функционировала; данные для обучения алгоритмов легко собирались. А под катом — поделюсь подробностями и кодом.
EXAM — State-of-the-art метод классификации текста
2019-01-12 в 14:27, admin, рубрики: nlp, nlp (natural language processing), Алгоритмы, глубокое обучение, классификация текста, классификация текстов, машинное обучение
Классификация текста — одна из наиболее распространенных задач в NLP и обучении с учителем, когда датасет содержит текстовые документы, а метки используются для тренировки текстового классификатора.
Читать полностью »
Разработка системы классификации тем обращений в контактный центр
2018-03-19 в 6:21, admin, рубрики: data mining, f мера, выделение темы обращения, классификация текстов, лемматизация, машинное обучение, нормализация, СемантикаЗдравствуйте, коллеги! В этой статье я кратко расскажу об особенностях построения решения по классификации тем обращений клиентов в контактный центр, с которыми мы столкнулись при разработке.
Определение тем обращений используется для отслеживания тенденций и прослушивания интересующих записей. Традиционно, эта задача решается путём проставления соответствующего тега оператором, но при данном подходе большую роль играет «человеческий» фактор, и тратится много человеко-часов работы операторов.
Классификация объявлений из соц. сетей. В поисках лучшего решения
2017-05-14 в 13:02, admin, рубрики: natural language processing, tomita, Вконтакте API, классификация текстов, машинное обучение, обработка естесственного языка, открытые данные, Разработка веб-сайтов, Регулярные выражения
Расскажу, как классификация текста помогла мне в поиске квартиры, а также почему я отказался от регулярных выражений и нейронных сетей и стал использовать лексический анализатор.
Читать полностью »