Недавно мы рассказывали о последнем поколении процессоров Intel Xeon (кодовое название Sapphire Rapids). Мы говорили об их новых аппаратных возможностях, ориентированных на ускорение задач глубокого обучения, разбирались с тем, как использовать их для ускорения распределённого дообучения трансформеров, занимающихся обработкой естественного языка, как применять их для ускорения работы таких моделей.
Рубрика «python» - 27
Ускорение работы моделей Stable Diffusion на процессорах Intel
2023-04-10 в 9:31, admin, рубрики: python, stable diffusion, Блог компании Wunder Fund, машинное обучение, ПрограммированиеПишем свой личный Duolingo на минималках
2023-04-09 в 16:09, admin, рубрики: python, английский язык, изучение языков, иностранные языки, ПрограммированиеПривет, меня зовут Емельянов Михаил, я Python-программист и я хотел бы показать вам свой небольшой «проект выходного дня» — Flywheel, микро-платформу для изучения иностранных языков — смесь Duolingo и Anki, программу, которая может помочь вам правильно писать на английском. Flywheel доступен в исходниках, лежит на GitHub.
Как вы, возможно, знаете, обобщенное знание иностранного языка можно разложить на четыре относительно независимые составляющие: чтение, письмо, слушание и говорение. К сожалению, тренировка одной из этих способностей не будет напрямую отражаться на остальных компонентах, поэтому, например, развивая навык чтения, мы достаточно опосредованно влияем на навык письма. Flywheel — «точилка» именно для письменного английского.
Если вы когда-нибудь пользовались Duolingo, то имеете представление о формате, в котором будет идти обучение. Последовательность проста: вот тебе фраза, переведи её на другой язык; программа запомнит, когда ты в последний раз переводил ту или иную фразу и насколько успешно у тебя это получилось; в зависимости от правильности ответа будет определено время, когда тебе нужно задать эту же фразу еще раз. В целом, на мой взгляд, как сам Duolingo, так и используемый им подход — просто гениальны. Но… Есть нюансы, которые несколько портят впечатления от процесса учёбы, и именно для их устранения я и задумал Flywheel.
Пора забывать GridSearch — встречайте ProgressiveGridSearch. Фракталы в ML, постепенно увеличиваем разрешение
2023-03-31 в 16:18, admin, рубрики: open source, python, искусственный интеллект, математика, машинное обучение, методы оптимизации, нейронные сети, подбор гиперпарметров, сезон machine learningЗдравствуйте, меня зовут Николай Стрекопытов и я придумал как подбирать гиперпараметры бескомпромиссно лучше GridSearch’а. Нужно лишь изменить порядок вычислений. И да, это заявка на обновление индустриального стандарта - скоро вы сможете улучшить свои ML-пайплайны заменой нескольких строчек кода.
Ирина, голосовой помощник — теперь и со вкусом GPT-3
2023-03-27 в 13:44, admin, рубрики: open source, python, голосовой помощник, голосовые интерфейсы, умный дом«Лама... Альпака...Чатгпт...» — раздавалась в уютненьком чатике по Ирине.
Хабр был не лучше — статьи по работе с GPT множились как грибы, а в комментах раздавались возгласы в духе «Дайте мне голосового помощника, с которым можно болтать!»
Если честно, еще в первой статье про Ирину я говорил, что небольшой фанат именно общения с виртуальным помощником. Помощник должен выполнять команды, казалось мне.
Ломаем текстовую капчу на примере VK или брутфорсинг до сих пор актуален
2023-03-26 в 18:07, admin, рубрики: AI, onnxruntime, python, TensorFlow, брутфорс, Вконтакте API, информационная безопасность, исскуственный интеллект, капча, машинное обучениеНемного о проблеме
Что мы знаем о капче? Капча — автоматизированный тест тьюринга, помогающий отсеивать подозрительные действия недобросовестных роботов от реальных людей. Но, к сожалению (или к счастью, смотря для кого), текстовая капча сильно устарела. Если еще 10 лет назад она была более-менее эффективным методом защиты от роботов, то сейчас ее может взломать любой желающий человек, более-менее разбирающийся в компьютере.
В данной статье-мануале я покажу, как создать собственную нейросеть по распознанию текстовых капч, имея под рукой домашний компьютер, базовые знания в python и неЧитать полностью »
Байки погромиста. Если кто-то скажет, что программирование — это скучно
2023-03-22 в 8:01, admin, рубрики: python, Блог компании Timeweb Cloud, истории, отладка, погромист, Программирование, Разработка веб-сайтов, факап, факапы, эпик, я у мамы программист
Вообще я, как правило, нормально программирую. Иногда даже такое заворачиваю, что сам тащусь весь день.
Генерация 2D мира с помощью клеточного автомата на Python
2023-03-13 в 9:00, admin, рубрики: pygame, python, Алгоритмы, клеточный автомат, математика, пиксель-арт, ПрограммированиеВсем привет! На написание этой статьи меня вдохновил автор YouTube канала PeaAshMeter. В своем видео автор показывает простейший генератор 2D мира, который основан на простейшем правиле клеточного автомата. Что такое клеточный автомат? Какие клеточные автоматы бывают? На эти и многие другие вопросы я попробую ответить.
Проект я решил написать на Python, но поскольку не являюсь экспертом в этой области, то любые замечания, предложения по улучшению кода или проекта — приветствуются!
5 полезных библиотек Python (с примерами)
2023-03-13 в 6:00, admin, рубрики: python, библиотеки, Блог компании RUVDS.com, Питон, подборки, полезное, полезное для разработки, ПрограммированиеPython остается топ 1 среди языков программирования по версии многих журналов и сайтов. Популярность языка и его большое сообщество привело к тому, что сейчас для Python существует огромное число библиотек. К сожалению, большая часть этих библиотек была создана энтузиастами и больше не поддерживается. Давайте посмотрим на 5 хороших развивающихся библиотек, которые могут помочь при решении практических задач.
Funcy
3000
Funcy содержит более 100 полезных методов и декораторов, собранных в одной библиотеке. Если вам важна чистота кода, и читать строки вида:Читать полностью »
Как создание бинарного классификатора открыло ящик Пандоры в стандартах владения английским языком
2023-03-12 в 11:05, admin, рубрики: deep learning, natural language processing, python, английский язык, бинарная классификация, датасеты по английскому языку, изучение языков, искусственный интеллект, машинное обучение, нейросеть, носители языкаВладение английским языком принято оценивать по системе CERF (Common European Reference Framework), состоящей из шести уровней, где уровень A1 – начинающие, а уровень С2 – профессионально владеющие иностранным языком. Международный уровень С2 часто позиционируется как “уровень образованного носителя”, и получение соответствующего сертификата зачастую является либо заветной мечтой, либо предметом гордости преподавателя-лингвиста.
ChatGPT в роли стримера
2023-03-11 в 8:03, admin, рубрики: api, chatgpt, gpt-3, OpenAI, python, искусственный интеллект, нейросети, стрим, стримингВ прошлом году мне выдалась возможность впервые поиграться c ChatGPT от OpenAI, однако практические применения, которые приходили мне в голову, оказались слишком сложными для реализации моими неполноценными студенческими знаниями, из-за чего мысли ушли сугубо в использовании нейронок в развлекательных целях.
Чуть позже широкую огласку получил ИИ-стример Neuro-sama, созданный vedal987.
В целом, тогда я и решил запустить этот эксперимент и попробовать сделать максимально дешево и сердито русскоговорящего стримера на основе GPT-моделей.