Рубрика «лингвистика» - 6

Подробное интервью с легендарным лингвистом, вышедшее 6 лет назад, но ничуть не утратившее своей актуальности. Ноам Хомский —  «современный Эйнштейн», как его называют, делится своими соображениями об устройстве человеческого мышления и языка, искусственном интеллекте, состоянии современных наук. На днях ему исполнилось 90 лет, и это кажется достаточным поводом для публикации статьи. Интервью ведет молодой учёный-когнитивист Ярден Кац, он сам прекрасно разбирается в предмете, поэтому беседа очень содержательна, а вопросы столь же интересны, как и ответы.

Ноам Хомский: где искусственный интеллект пошел не туда? - 1

Читать полностью »

Научиться программировать — значит не только развить полезный навык, но и приобрести особый тип мышления. Программисты умеют хорошо решать математические и логические задачи. Также они обращают внимание на детали, моделируют ситуации в обычной жизни и дают оценку на основе большого количества факторов.

Программист на всю голову: как кодинг влияет на мышление - 1

В преддверии нашего курса Go Workshop рассказываем, что психологи, лингвисты и педагоги думают о влиянии кодинга на мозг, при чем тут австралийские индейцы и гипотеза Сепира-Уорфа.
Читать полностью »

Как двусмысленность в языке может привести к появлению уникальных табу

Располагает ли китайский язык к суевериям? - 1

Каждый год больше миллиарда человек по всему миру празднуют Китайский новый год и занимаются незаметными лингвистическими танцами с удачей. Их можно представить себе в виде набора праздничных ритуалов, напоминающих ухаживание. Чтобы привлечь удачу в их жизни, они могут украшать дома и двери бумажными вырезками счастливых слов или фраз. Люди, которым нужно подстричься, стремятся сделать это до Нового года, поскольку слово «волосы» (фа) звучит похоже на слово «процветание» – а кому надо отрезать процветание, если даже вам надо просто подровнять? В праздничном меню часто присутствуют рыба, поскольку её название (ю) звучит, как слово «излишек»; водоросли фэт чой, поскольку на кантонском диалекте это звучит как «богатей»; апельсины, поскольку в определённых регионах их название звучит, как «удача».

Англоязычные [и русскоязычные] читатели способны оценить хорошую игру слов, и обыгрывание омофонов (слов, звучащих одинаково, но имеющих разное значение) – один из приёмов создания хорошей рекламы. Но китайские традиции возводят игру слов на новый уровень – такой, который глубоко уходит в корни культуры, в которой удачи упорно добиваются при помощи позитивных слов и дел, а неудачу отталкивают, устраняя негативное. Число «четыре» запятнано омофонией со словом «смерть» – многие китайцы никогда не купят дом с адресом, содержащим 4. В графическом дизайне часто встречаются рыбы и летучие мыши, потому что они звучат так же, как слова «изобилие» и «удача». Традиции дарения подарков преисполнены омофонных табу; можно дарить яблоки, потому что они звучат, как «мир», но не груши, потому что их название похоже на «разлуку». То, почему определённые объекты или числа считаются счастливыми или несчастливыми часто объясняется как само собой разумеющееся явление, происходящего из-за похожим образом звучащих слов.
Читать полностью »

Взламывая коды языка «Аватара» - 1

Одним жарким четвергом в июле 2013 года я встретился с долговязым молодым человеком на станции Юнион в г. Вашингтон, О.К. Он вёл себя энергично и немного нервно; пожав мне руку, он торопливо провёл меня к серебристому седану, за рулём которого сидела его подруга Сара. И хотя он представился, как Иен Райли, в следующие пять дней он был для меня Фтиафпи. Фтиафпи, что означает «ради изучения» – это его имя на языке На’ви, специально разработанном для эпического фильма Джеймса Камерона 2009 года, «Аватар».

Иен и Сара везли меня на AvatarMeet, ежегодное собрание фанатов и говорящих на На’ви, проходящее в обширных лесах национального парка Шенандоа в Виргинии. По мере нашего приближения к месту сбора пейзаж становился зеленее, городских голубей заменяли орлы, а дорожные знаки всё больше указывали на водопады и фермы вместо шоссе. Чем ближе мы подъезжали, тем сильнее Сара раздражалась из-за дорожного движения, а Райли на переднем сиденье выказывал всё больше признаков волнения из-за предвкушения встречи. Надпись на напечатанной на заказ футболке Райли гласила «Oeru syaw fko Ftiafpi», что на На’ви означает «Меня зовут Фтиафпи». Это была его первая встреча за два года, как сообщил он, потянувшись и тронув Сару за плечо. «И у Сары это первый раз», сказал он, сияя, в то время как она терпеливо убрала его руку и сосредоточилась на дороге.
Читать полностью »

Новый год — время чудес и подарков. Главным чудом, которое подарила нам природа, безусловно является естественный язык и человеческая речь. А мы, в свою очередь, хотим сделать новогодний подарок всем исследователям этого феномена и поделиться датасетом по открытой семантике русского языка.

В статье мы позволим себе немного подискутировать на тему смыслов, расскажем как мы пришли к необходимости создания открытой семантической разметки, расскажем о настоящих результатах и будущих направлениях этой большой работы. И, конечно, дадим ссылку на датасет, который вы сможете скачать и использовать для своих экспериментов и исследований.Читать полностью »

Небольшая доза алкоголя действительно улучшает навыки владения иностранным языком - 1Группа голландских, британских и немецких специалистов по психофармакологии опубликовала научную статью, в которой прояснили некоторые аспекты влияния на высшую нервную деятельность отравления малыми дозами алкоголя.

Наука достаточно хорошо изучила отрицательные эффекты влияния алкоголя на мозг. Исследования показали, что ядовитое вещество подавляет разные аспекты когнитивной функциональности, в том числе самоконтроль, рабочую память и способность переключаться между задачами (многозадачность). Все эти способности крайне необходимы для эффективного восприятия, обработки и воспроизведения речи. Из этого можно сделать вывод, что пьяный человек будет хуже понимать речь и хуже говорить. Это косвенно подтвердили тесты на фонетическую беглость (способность генерировать слова, который начинаются с определённой буквы).

В новой работе учёные поставили задачу исследовать, как употребление алкоголя влияет на способность говорить на иностранном языке (субъективно и объективно) у людей, которые владеют несколькими языками.
Читать полностью »

Здравствуйте. Это статья об синтаксическом анализе предложений, их представлении. Для разбора предложений будет использоваться пакет NLTK и язык программирования Python (версии 2.7).

Вступление

В моей предыдущей статье мы рассматривали морфологические анализаторы и их использование. Настоятельно рекомендую прочитать её, чтобы лучше понять данную статью. Также там рассматривается установка и настройка пакета NLTK.
Читать полностью »

Описание процессов машинного перевода основанного на базе правил (Rule-Based), машинного перевода на базе фраз (Phrase-Based) и нейронного перевода

image

В этой публикации нашего цикла step-by-step статей мы объясним, как работает нейронный машинный перевод и сравним его с другими методами: технологией перевода на базе правил и технологией фреймового перевода (PBMT, наиболее популярным подмножеством которого является статистический машинный перевод — SMT).

Результаты исследования, полученные Neural Machine Translation, удивительны в части того, что касается расшифровки нейросети. Создается впечатление, что сеть на самом деле «понимает» предложение, когда переводит его. В этой статье мы разберем вопрос семантического подхода, который используют нейронные сети для перевода.

Давайте начнем с того, что рассмотрим методы работы всех трех технологий на различных этапах процесса перевода, а также методы, которые используются в каждом из случаев. Далее мы познакомимся с некоторыми примерами и сравним, что каждая из технологий делает для того, чтобы выдать максимально правильный перевод.
Читать полностью »

Компиляторы, интерпретаторы… Сколько им посвещено книг и проектов! Баста, надоело!
А вот сунешся в область анализа естественных языков, и никакой информации! А все что есть как-то очень сложно, непонятно и не универсально.
Была у меня идея создать средневековую лингвистическую новеллу. Чтобы можно было разговаривать с персонажами на каком нибудь древнем естественном или вымышленном языке. На Латыни например? И на Квенья. И чтобы они понимали. А почему бы и нет?
Читать полностью »

В одной только России насчитывается более сотни языков, многие из которых являются родными для десятков и сотен тысяч человек. Причем часть из них ограничена в употреблении или даже находится на грани исчезновения. Машинный перевод мог бы помочь в сохранении этих языков, но для этого надо решить главную проблему всех подобных систем – отсутствие примеров для обучения.

Яндекс работает над технологией машинного перевода с 2011 года, и сегодня я расскажу о нашем новом подходе, благодаря которому становится возможным создать переводчик для тех языков, для которых ранее это было сделать затруднительно.

Как Яндекс научил машину самостоятельно создавать переводы для редких языков - 1

Правила против статистики

Машинный перевод, то есть автоматический перевод с одного человеческого языка на другой, зародился в середине прошлого века. Точкой отсчета принято считать Джорджтаунский эксперимент, проведенный 7 января 1954 года, в рамках которого более 60 фраз на русском языке были переведены компьютером на английский. По сути, это был вовсе и не эксперимент, а хорошо спланированная демонстрация: словарь включал не более 250 записей и работал с учетом лишь 6 правил. Тем не менее результаты впечатлили публику и подстегнули развитие машинного перевода.Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js