Казалось бы, в Юникод включили уже все возможные и невозможные символы. В последней версии Unicode 7.0 добавлено 23 новых письменности, включая древнепермское письмо и почти полностью расшифрованное линейное письмо А минойской цивилизации 2000 г до н.э., сотни экзотических эмотиконов.
Общее количество символов в Unicode превысило 110 000 штук. Казалось бы, там уже есть все распространённые символы. Оказывается, это не так. До сих пор остались люди, которые не могут написать в Юникоде даже собственное имя. Им приходится прибегать к разным трюкам.
О своей проблеме рассказал индийский IT-специалист, имя которого мы не можем правильно напечатать, разве что в транслитерации: Адитья Мукереджи.
Родной язык парня — бенгальский, это седьмой по популярности язык в мире, который значительно опережает по численности носителей даже русский. Вы можете представить, что не все символы русского языка представлены в Unicode? А вот для бенгальского это привычное дело.
Бенгальские символы
Бенгальский представлен в Unicode с самой первой версии, но с самого начала в нём не хватало символов. Жителям страны приходилось изобретать велосипеды, восполняя недостающие символы при письме комбинациями похожих букв и цифр, как в хакерском l33tspeak. Так, его собственное имя можно написать со сходной графемой из родственной письменности: আদিত্য.
Отсутствующая буква
В 2005 году некоторые символы добавили, но не все. В его имени до сих пор не хватает буквы, хотя оно — вовсе не какая-то экзотика, а повсеместно встречается в Индии и даже входит в 1000 самых популярных имён в США.
Адитья Мукереджи обвиняет в технической некомпетентности сотрудников консорциума Unicode, которые занимаются подготовкой стандарта. Смелый специалист даже делает расистские намёки. По его мнению, среди сотрудников слишком много белых англоговорящих людей. Дерзость можно понять: он как продвинутый пользователь цифровой техники немало уже натерпелся за свою жизнь из-за «неудачного» имени.
Адитья опасается, что консорциум Unicode не собирается изменять список из 224 024 символов, которые планируется включить в Unicode в ближайшие годы.
Эта история представляется ещё и интересным примером того, что современные технологии могут не только упростить жизнь, но и осложнить её.
Автор: alizar