Архив за 10 июня 2020 - 3

Компания Zadak сообщила о выпуске твердотельного накопителя Spark. Этот накопитель типоразмера M.2 оснащен интерфейсом PCIe Gen3 x4 и может передавать данные со скоростью до 3200 МБ/с и 3000 МБ/с в режимах последовательного чтения и записи соответственно.

Источники подтверждают, что в планы компании TSMC входит производство однокристальных систем Apple A16 для смартфонов iPhone и планшетов iPad.

Читать полностью »

Чтобы машины могли обрабатывать текст на русском и «понимать» его, в NLP используются универсальные языковые модели и трансформеры — BERT, RoBERTa, XLNet и другие — архитектуры от 100 миллионов параметров, обученные на миллиардах слов. Все оригинальные модели появляются обычно для английского, показывают state-of-the-art в какой-нибудь прикладной задаче и только спустя полгода-год появляются и для русского языка, без тюнинга архитектуры.

Люди ломаются на логике, роботы — на всем понемногу. Экзамены по русскому для NLP-моделей - 1

Чтобы корректнее обучать свою модель для русского или другого языка и адаптировать её, хорошо бы иметь какие-то объективные метрики. Их существует не так много, а для нашей локали и вовсе не было. Но мы их сделали, чтобы продолжить развитие русских моделей для общей задачи General Language Understanding.

Мы — это команда AGI NLP Сбербанка, лаборатория Noah’s Ark Huawei и факультет компьютерных наук ВШЭ. Проект Russian SuperGLUE — это набор тестов на «понимание» текста и постоянный лидерборд трансформеров для русского языка.
Читать полностью »

image

Привет. Хорошие новости: мы успешно завершили краудсорсинговый проект «Открой историю Большого» по оцифровке программ, афиш и фотографий, которые хранятся в музее Большого театра. Итогами делимся на сайте openbolshoi.ru, а в этом посте рассказываем, как технически был организован проект.

О том, почему мы начали заниматься этим проектом и что сделали на первом этапе, можно почитать здесь. А что же было дальше? После первой части проекта мы благодаря ABBYY FineReader PDF и с помощью волонтеров подготовили файлы программ и афиш в формате PDF с вычитанным текстовым слоем и передали их музею Большого театра. Теперь все данные хранятся в электронном виде, и сотрудники используют их, чтобы искать и копировать нужную информацию. Это быстрее и удобнее, чем перебирать документы в шкафах и перепечатывать текст из оригиналов.

Но как узнать больше о представлениях, а также о людях, чьи судьбы тесно связаны с историей театра? Как собрать статистику:

Помогли технологии Natural Language Processing (NLP), разработанные в ABBYY. Сегодня мы расскажем, как на втором этапе проекта алгоритмы извлекли из программ и афиш необходимые сведения, заполнили поля базы данных, а затем 7500 волонтеров проверили и дополнили информацию. А в конце поста читайте, как сейчас создается электронный архив музея с удобным поиском по всем представлениям и персонам.
Читать полностью »

Пару недель назад мы говорили о том, что Oppo якобы нанимает крупных специалистов для создания собственной мобильной однокристальной системы. Тогда говорилось о том, что компания привлекает бывших сотрудников MedaiTek, Unisoc, а также ищет возможности заполучить специалистов Qualcomm и HiSilicon.

В языках программирования меня всегда интересовало их внутреннее устройство. Как работает тот или иной оператор? Почему лучше писать так, а не иначе? Подобные вопросы не всегда помогают решить задачу «здесь и сейчас», но в долгосрочной перспективе формируют общую картину языка программирования. Сегодня я хочу поделиться результатом одного из таких погружений и ответить на вопрос, что происходит при модификации tuple'а в list'е.
Читать полностью »

Компания Samsung, похоже, готовится выпустить не только топовый SSD Samsung 980 Pro, но и модели совершенно иного класса и позиционирования. В недрах сайта Amazon обнаружилось упоминание накопителей Samsung 870 QVO объёмом до 8 ТБ!

Месяц назад неожиданно появилась информация о том, что смартфон Samsung Galaxy Note9, который на тот момент уже получил оболочку One UI 2.0, получит ещё и One UI 2.1.

Тогда говорилось, что обновление стоит ждать в июне, и вот оно вышло. При этом первыми новую прошивку получили владельцы аппаратов в Германии, а не в Южной Корее, как считалось ранее.

Твердотельный накопитель Samsung 980 Pro был представлен ещё в начале года, но на прилавки пока так и не попал. Если верить инсайдеру Ice universe, купить такой SSD можно будет примерно через два месяца. Точной даты источник не называет, но вполне можно ориентироваться на первую половину августа.

Накануне презентации новой PlayStation 5 команда Яндекс.Маркета решила опубликовать результаты исследования спроса на игровые консоли и игры в России за прошедший год.


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js