Компиляторы, интерпретаторы… Сколько им посвещено книг и проектов! Баста, надоело!
А вот сунешся в область анализа естественных языков, и никакой информации! А все что есть как-то очень сложно, непонятно и не универсально.
Была у меня идея создать средневековую лингвистическую новеллу. Чтобы можно было разговаривать с персонажами на каком нибудь древнем естественном или вымышленном языке. На Латыни например? И на Квенья. И чтобы они понимали. А почему бы и нет?
Читать полностью »
Рубрика «лингвистический анализ»
Универсальный грамматический анализатор естественных языков с нуля. Выпуск 1
2017-03-11 в 12:12, admin, рубрики: Компиляторы, лингвистика, лингвистический анализ, лингвистическое по, метки: КомпиляторыМожет ли машина научить английскому языку?
2016-05-20 в 8:32, admin, рубрики: python, Блог компании Онлайн-школа английского Skyeng, лингвистический анализ, машинное обучение, обучение английскому, метки: обучение английскому
Биткоин-бот имени Дональда Трампа, победа AlphaGo над одним из сильнейших игроков в го Ли Седолем, изучение английского языка — что объединяет эти три ситуации? Везде в той или иной степени присутствует машинное обучение.
Компьютер может не только генерировать сюжетную канву, как Scheherazade, или отвечать на письма вместо пользователей, как Google Smart Reply, но и создавать идеальные учебники английского языка.
Читать полностью »
Сосчитать незримое: достоверно определяем словарный запаc
2016-05-19 в 16:41, admin, рубрики: Алгоритмы, Блог компании Онлайн-школа английского Skyeng, изучение языка, корпус текстов, лингвистический анализ, Семантика, метки: изучение языка, корпус текстов, лингвистический анализ
В школе Skyeng мы редко обучаем английскому с нуля. Обычно к нам приходят люди, уже обладающие каким-то набором знаний, причем этот набор бывает самым разным. Для того, чтобы обучение было полезным, нам нужно как-то определить границу этих знаний. Если в случае грамматики это относительно просто (выясняется на первых занятиях с методистом), то уточнение границ словарного запаса – задача не самая тривиальная. Для ее решения мы разработали и запустили инструмент WordMash.
Google слышит лучше, искать проще
2015-10-01 в 11:27, admin, рубрики: android, Google, Блог компании ua-hosting.company, браузеры, ГНС, голосовой поиск, звук, лингвистический анализ, нейронные сети, периодические нейронные сети, ПНС, поиск, фреймы, хостинг, шумGoogle объявил о том, что они доработали свою систему голосового поиска для того что бы добиться, улучшенного распознавания речи пользователя в шумных местах.
Это всегда была одна из лучших систем распознавания речи, особенно она удобна при поиске с использованием смартфонов. Теперь функция голосового поиска стала еще более развитой чем когда-либо. Блог Google Research описывает в общих чертах улучшения, которые были приняты в обновленной системы. Читать полностью »
6 игр за 6 недель — игра пятая
2014-12-22 в 14:06, admin, рубрики: mobile development, Блог компании Papa Buba Diop, конан дойль, лингвистический анализ, разработка под iOS-Холмс, как вы узнали, что я пхп-специалист?
-Элементарно, Ватсон, у вас слон на свитере.
Игра пятая — Пляшущие человечки. Создана по мотивам рассказа Конан-Дойля The adventure of dancing men.
Игра (на момент публикации статьи) не прошла модерацию в магазине. Я объясню почему. Сюжет игры классический — берется 10 строк текста из бессмертного романа А.С. и одинаковые буквы меняются на одинаковые символы. Лингвисты мгновенно расшифровывают. Порог вхождения — высокий. В результате месяца игры я наизусть выучил Евгения Онегина.
Впрочем, картинку типа этой — расшифруют все, кто говорит по-русски.
Рисунок 1. Слово из трех букв
Это слово — либо КАК, либо ИЛИ, либо ОНО, либо ТОТ. Конечно, любители немецкого скажут, что это второе слово из фразы ХЕНДЕ ХОХ. Но нет, Пушкин не знал немецкого.
Вернусь к вопросу о непрошедшей проверке.
На экране с очередной загадкой всегда горит строка подсказки — в ней все символы выстроены в порядке убывания их наличия в тексте. Самые распространенные буквы обычно Е Н или О.
Рисунок 2. Строка подсказки
Так вот, в этой строке подсказки затаилась крамола. Одна из картинок не прошла модерацию.
Угадайте какая?
Читать полностью »
Немцы создали библиотеку пьяных аудиозаписей
2014-12-05 в 12:30, admin, рубрики: big data, data mining, автомобили, лингвистический анализ, машинное обучение, пьянству бой Эпиграф:
— Пил?
— Не пил!
— Скажи Гибралтар.
— Пил.
Тема немного курьезная, но мне кажется, что именно таких в последнее время не хватает на Хабре. Особенно в пятницу.
Итак, немецкие ученые из двух университетов Мюнхена создали базу аудизаписей, где записа речь 162-х людей в состояние алкогольного опьянения. Данные собирались с 2007 года по 2009 и теперь на основании базы данных создается языковой корпус (статья о корпусах на Вики) Alcohol Language Corpus (ALC).Читать полностью »