Рубрика «natural language processing» - 14

Чем занимаются в департаменте R&D ABBYY: NLP Advanced Research Group

2018-11-22 в 9:55, admin, рубрики: ABBYY, natural language processing, nlp, R&D, Блог компании ABBYY, лекция, машинное обучение, МФТИ, обработка естественного языка, саммаризация, синтаксический анализ, Школа глубокого обучения, эллипсис

Чем занимаются в департаменте R&D ABBYY: NLP Advanced Research Group - 1 Чем занимаются в департаменте R&D в ABBYY? Чтобы ответить на этот вопрос, мы начинаем серию публикаций о том, как наши разработчики создают новые технологии и совершенствуют существующие решения. Сегодня расскажем про направление Natural Language Processing (NLP).

Мы в ABBYY занимаемся исследованиями в сфере обработки естественного языка и беремся за сложные научные задачи, для которых пока нет готовых решений. Так мы создаем инновации, которые ложатся в основу продуктов и помогают нашим заказчикам, да и нам двигаться вперед. Кстати, 24 ноября на лекции в Школе глубокого обучения при МФТИ руководитель NLP Advanced Research Group в департаменте R&D ABBYY Иван Смуров расскажет, какие в мире есть задачи по анализу текста и как современные нейросети позволяют их решать. А в этом посте Иван рассказал нам о трех задачах, которыми занимается сейчас. Читать полностью »

Building client routing – semantic search at Profi.ru

2018-11-03 в 10:02, admin, рубрики: data science, deep learning, machine learning, natural language processing, nlp (natural language processing), python3, pytorch, машинное обучение

Building client routing / semantic search and clustering arbitrary external corpuses at Profi.ru

TLDR

This is a very short executive summary (or a teaser) about what we managed to do in approximately 2 months in the Profi.ru DS department (I was there for a bit longer, but onboarding myself and my team was a separate thing to be done at first).

Читать полностью »

From zero to “Actions on Google” hero: начало

2018-08-10 в 9:43, admin, рубрики: android, android development, dialogflow, google assistant, natural language processing, Блог компании REDMADROBOT, голосовой помощник, голосовые ассистенты, голосовые интерфейсы, Разработка для интернета вещей, Разработка под android, Хакатоны

Хакатон Google, и все, что нужно, чтобы начать разрабатывать свои приложения для ассистента.

Google организовал хакатон, посвященный технологии Actions On Google. Это хорошая возможность получить опыт и подумать, как начать делать conversation user interface (CUI) для наших приложений. Поэтому мы собрали команду из двух Android-разработчиков: shipa_o, raenardev и дизайнера comradeguest и отправились участвовать.

Читать полностью »

Google Cloud: новая платформа и возможности машинного обучения

2018-05-25 в 14:37, admin, рубрики: cloud computing, Google, Google Cloud Platform, natural language processing, Блог компании Издательский дом «Питер», Облачные вычисления, Программирование

Здравствуйте, коллеги.

В последнее время мы вынашиваем планы издать книгу по обработке естественного языка. Одним из наиболее масштабных решений, которые определяют перспективы этой отрасли, несомненно, является платформа Google Cloud, как нельзя лучше адаптированная для машинного обучения. Просим высказываться о востребованности этой книги

Google Cloud: новая платформа и возможности машинного обучения - 1

и почитать под катом о небольшой библиотеке, предназначенной для обработки естественного языка на R.
Читать полностью »

Обработка текстов на естественных языках

2018-05-18 в 7:31, admin, рубрики: data mining, data science, machine learning, natural language processing, nlp, Блог компании Mail.Ru Group, машинное обучение, Семантический анализ текста

Обработка текстов на естественных языках - 1

Сегодня мы затрагиваем такую интересную тему, как естественные языки. Сейчас в эту область вкладываются очень большие деньги и в ней решают немало разнообразных задач. Она привлекает внимание не только индустрии, но и научного сообщества.
Читать полностью »

Новогодний датасет: открытая семантика русского языка

2017-12-20 в 12:04, admin, рубрики: natural language processing, естественный язык, лингвистика, машинное обучение, открытые данные, Семантика, семантическая разметка, сентимент-анализ, Эмоции

Новый год — время чудес и подарков. Главным чудом, которое подарила нам природа, безусловно является естественный язык и человеческая речь. А мы, в свою очередь, хотим сделать новогодний подарок всем исследователям этого феномена и поделиться датасетом по открытой семантике русского языка.

В статье мы позволим себе немного подискутировать на тему смыслов, расскажем как мы пришли к необходимости создания открытой семантической разметки, расскажем о настоящих результатах и будущих направлениях этой большой работы. И, конечно, дадим ссылку на датасет, который вы сможете скачать и использовать для своих экспериментов и исследований.Читать полностью »

Как научить свою нейросеть анализировать морфологию

2017-10-12 в 11:00, admin, рубрики: natural language processing, nlp, python, глубокое обучение, Компьютерная лингвистика, машинное обучение, морфологический анализ, морфология, рекуррентная нейронная сеть

Недавно мы рассказывали про генератор стихов. Одной из особенностей языковой модели, лежащей в его основе, было использование морфологической разметки для получения лучшей согласованности между словами. Однако же у использованной морфоразметки был один фатальный недостаток: она была получена с помощью “закрытой” модели, недоступной для общего использования. Если точнее, выборка, на которой мы обучались, была размечена моделью, созданной для Диалога-2017 и основанной на закрытых технологиях и словарях ABBYY.

Мне очень хотелось избавить генератор от подобных ограничений. Для этого нужно было построить собственный морфологический анализатор. Сначала я делал его частью генератора, но в итоге он вылился в отдельный проект, который, очевидно, может быть использован не только для генерации стихов.

Вместо морфологического движка ABBYY я использовал широко известный pymorphy2. Что в итоге получилось? Спойлер — получилось неплохо.

Читать полностью »

Технологии больших данных в работе с бактериями микробиоты. Лекция в Яндексе

2017-06-18 в 18:50, admin, рубрики: complexity science, Hbase, natural language processing, text mining, transfer learning, антибиотики, биоинформатика, биоинформатические алгоритмы, Блог компании Яндекс, геном, геномика, гены, Исследования и прогнозы в IT, калории, микробиология, секвенирование, секвенирование генома

Мы часто говорим о задачах, которые лежат на стыке той или иной классической науки и анализа данных. В сегодняшнем докладе эта идеология представлена воочию — большую часть доклада читает учёный, а о конкретных методах и инструментах рассказывает программист.

Под катом — расшифровка и основная часть слайдов.

Читать полностью »

Обзор исследований в области глубокого обучения: обработка естественных языков

2017-06-05 в 12:54, admin, рубрики: deep learning, gru, LSTM, machine learning, natural language processing, neural networks, RNN, wunder fund, wunderfund, Блог компании Wunder Fund, машинное обучение

Обзор исследований в области глубокого обучения: обработка естественных языков - 1

Это третья статья из серии “Обзор исследований в области глубокого обучения” (Deep Learning Research Review) студента Калифорнийского университета в Лос-Анджелесе Адита Дешпанда (Adit Deshpande). Каждые две недели Адит публикует обзор и толкование исследований в определенной области глубинного обучения. В этот раз он сосредоточил свое внимание на применении глубокого обучения для обработки текстов на естественном языке.
Читать полностью »

Классификация объявлений из соц. сетей. В поисках лучшего решения

2017-05-14 в 13:02, admin, рубрики: natural language processing, tomita, Вконтакте API, классификация текстов, машинное обучение, обработка естесственного языка, открытые данные, Разработка веб-сайтов, Регулярные выражения

Классификация объявлений из соц. сетей. В поисках лучшего решения - 1
Расскажу, как классификация текста помогла мне в поиске квартиры, а также почему я отказался от регулярных выражений и нейронных сетей и стал использовать лексический анализатор.
Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Рубрика «natural language processing» - 14

Чем занимаются в департаменте R&D ABBYY: NLP Advanced Research Group

Building client routing – semantic search at Profi.ru

Building client routing / semantic search and clustering arbitrary external corpuses at Profi.ru

TLDR

From zero to “Actions on Google” hero: начало

Google Cloud: новая платформа и возможности машинного обучения

Обработка текстов на естественных языках

Новогодний датасет: открытая семантика русского языка

Как научить свою нейросеть анализировать морфологию

Технологии больших данных в работе с бактериями микробиоты. Лекция в Яндексе

Обзор исследований в области глубокого обучения: обработка естественных языков

Классификация объявлений из соц. сетей. В поисках лучшего решения

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «natural language processing» - 14

Building client routing / semantic search and clustering arbitrary external corpuses at Profi.ru

TLDR

Новости

Актуальные темы

Архив