Подборка ресурсов по математике, статистике и программированию для начинающих Дата Сайентистов. Ознакомьтесь с материалами, если вы планируете учиться на онлайн-курсах. Так вы опередите одногруппников, а заодно прокачаете полезный навык — изучать дополнительные материалы самостоятельно.
Читать полностью »
Рубрика «python» - 101
Что почитать и посмотреть для старта в Data Science: книги, словари и курсы
2019-09-11 в 9:24, admin, рубрики: data science, python, sql, базы данных, Блог компании Нетология, математика, нетология, статистика, Статистика в ITJWT: Атака на цифровую подпись VS MAC-атака
2019-09-11 в 8:55, admin, рубрики: jwt, pentest, python, Блог компании OTUS. Онлайн-образование, информационная безопасностьВсем привет. Ни для кого не секрет, что ежемесячно OTUS запускает несколько абсолютно новых уникальных курсов, в этом месяце в их число вошел курс «Пентест. Практика тестирования на проникновение». По устоявшейся традиции, в преддверии старта курса, делимся с вами переводом полезного материала по данному направлению.
Во время последнего пентеста я наткнулся на схему авторизации на основе JSON Web Token (или просто JWT). JWT состоит из трех частей: заголовок, полезная нагрузка, информация для верификации. Первая часть заголовка содержит имя алгоритма, который в дальнейшем будет использоваться для верификационной части JWT. Это опасно, так как злоумышленник может изменить эту информацию и таким образом (возможно) проконтролировать, какая схема будет использоваться сервером для проверки.Читать полностью »
Сравнение популярных CLI-библиотек для Python: click, cement, fire и другие
2019-09-11 в 7:25, admin, рубрики: argparse, cement, cleo, cli, click, docopt, fire, python, python-firePython — отличный язык для консольных приложений, и это подчёркивает большое количество библиотек для этих задач. Но какие вообще библиотеки существуют? А какую лучше взять? В этом материале сравниваются популярные и не очень инструменты для консольного мира и дана попытка ответить на второй вопрос.
Для удобства чтения обзор разделён на два поста: в первом сравнивается шесть самых популярных библиотек, во втором — менее популярные и более специфичные, но всё же заслуживающие внимания.
Читать полностью »
Нетипичный «ls» или как развлекаются линуксоиды
2019-09-11 в 4:34, admin, рубрики: bash, coreutils, findutils, perl, python, ненормальное программирование, ОболочкиОднажды в телеграм чат питерского сообщества линуксоидов SPbLUG я кинул забавную задачку:
Выведите список файлов в домашней директории максимально возможным количеством способов, без использования ls или его алиасов(1 способ — 1 балл)
Такое-же задание, чуть позже, прилетело в ещё один чат и вот что из этого получилось:Читать полностью »
Угадай меня, если сможешь: прогнозирование рейтинга фильма до его выхода
2019-09-10 в 20:13, admin, рубрики: data mining, data science, machine learning, open data, python, sklearn, машинное обучение, открытые данныеНедавно мне на глаза попался датасет на Kaggle с данными о 45 тысячах фильмов с Full MovieLens Dataset. Данные содержали не только информацию об актерах, съемочной команде, сюжете и т.п., но и оценки, выставленные фильмам пользователями ресурса (26 миллионов оценок от 270 тыс.пользователей).
Стандартная задача для таких данных — это рекомендательная система. Но мне в голову почему-то пришло прогнозирование рейтинга фильма на основе информации, доступной до его выхода. Я не знаток кинематографа, и поэтому обычно ориентируюсь на рецензии, выбирая что посмотреть из новинок. Но ведь рецензенты тоже несколько biased — они-то смотрят гораздо больше разных фильмов, чем рядовой зритель. Поэтому спрогнозировать, как оценит фильм обычная публика, показалось занятным. Читать полностью »
Хабрастатистика: как живет Хабр без geektimes
2019-09-10 в 20:10, admin, рубрики: Geektimes, python, веб-аналитика, Программирование, Социальные сети и сообщества, статистика, Статистика в ITПривет.
Данная статья является логическим продолжением рейтинга Лучших статей Хабра за 2018 год. И хотя год еще не закончился, но как известно, летом произошли изменения в правилах, соответственно, стало интересно посмотреть, повлияло ли это на что-нибудь.
Кроме собственно статистики, будет приведен и обновленный рейтинг статей, а также немного исходников для тех кому интересно, как это работает.
Для тех, кому интересно что получилось, продолжение под катом.
Читать полностью »
Питон, пожирающий мир: как побочный проект одного разработчика стал популярнейшим языком программирования
2019-09-10 в 11:00, admin, рубрики: python, гвидо ван россум, ПрограммированиеРазочаровавшись в недостатках существовавших языков программирования, Гвидо Ван Россум создал язык Python. Сейчас этот язык используют миллионы людей, и Ник Хит беседует с ван Россумом о прошлом и будущем языка.
Гвидо Ван Россум в штаб-квартире Dropbox в 2014 году
В конце 1994 года группа избранных программистов с разных концов США собралась для обсуждения своего нового секретного оружия.
Барри Уорсо был одним из двух десятков разработчиков, собравшихся на самый первый воркшоп, посвящённый новому языку программирования Python, и вспоминает, насколько явным было радостное возбуждение его первых пользователей.
«Особенно мне запомнился один человек, сказавший: ’Не говорите никому, что я здесь, потому что то, что мы используем питон, является конкурентным преимуществом’. Это было их секретное оружие».
Читать полностью »
Как обойти капчу, используя звук
2019-09-08 в 10:42, admin, рубрики: captcha, pocketsphinx, python, speech recognition, капчаНа просторах интернета до сих пор остаются актуальными капчи, которые в качестве опции предлагают прослушать текст с картинки, нажав на соответствующую кнопку. Если кому-то знакома картинка ниже и/или есть интерес как ее обойти, используя систему оффлайн распознавания звука, предлагается к прочтению.
Передача двумерных списков из python в DLL
2019-09-07 в 15:05, admin, рубрики: C, c++, ctypes, dll, pythonВсем привет.
Решил несколько дополнить статью C/C++ из Python.
Передача стандартных типов, таких как int, bool, float и так далее довольно проста, но мало необходима. С такими данными быстро справится и сам python, и врядли у кого-то возникнет необходимость вынесения части такого кода в библиотеку C/C++.
А вот передача больших массивов данных, или еще лучше двумерных массивов данных, или даже двумерных массивов объектов.
Тут уже все не так очевидно, и есть ряд вещей, которые думаю можно осветить для тех кто хочет существенно ускорить трудные для интерпретатора python участки кода.
Приведенный под катом пример не очень полезный для применения, но думаю достаточный, чтобы осветить все нюансы данной процедуры.
Python + OpenCV + Keras: делаем распознавалку текста за полчаса
2019-09-07 в 13:41, admin, рубрики: cnn, orc, python, искусственный интеллект, машинное обучение, нейронные сети, обработка изображений, Программирование, распознавание текстаПосле экспериментов с многим известной базой из 60000 рукописных цифр MNIST возник логичный вопрос, есть ли что-то похожее, но с поддержкой не только цифр, но и букв. Как оказалось, есть, и называется такая база, как можно догадаться, Extended MNIST (EMNIST).
Если кому интересно, как с помощью этой базы можно сделать несложную распознавалку текста, добро пожаловать под кат.