Рубрика «jupyter notebook»

Инструменты Python для анализа данных на примере данных стриминг-сервиса

2025-03-26 в 10:16, admin, рубрики: analytics, jupyter notebook, numpy, pand, python3, seaborn

В данной статье будет рассказано о некоторых методах библиотек Python, с помощью которых можно производить анализ данных, писать аналитические запросы к набору данных, визуализировать необходимую информацию в виде графиков и гистограмм.

Для примеров использования методов библиотек Python взят готовый датасет с информацией о пользователях онлайн-кинотеатра, о фильмах и их рейтинге. Будут использованы три библиотеки: Pandas, Numpy для аналитических запросов и Seaborn для визуализации.

1. Обработка данных

1.1 Импортирование файлов

Читать полностью »

Python для начинающих дата-аналитиков: как настроить виртуальное окружение?

2025-03-10 в 15:16, admin, рубрики: data analysis, jupyter notebook, pandas, pip, python, UV, venv

Введение

Привет! Меня зовут Женя и я работаю аналитиком данных. В этой статье я бы хотел рассказать начинающим аналитикам о том, как правильно настроить окружение для работы с Python. Когда я только начинал заниматься анализом данных, концепция питоновского виртуального окружения вводила меня в ступор, и здесь я постараюсь показать, что в ней нет ничего сложного.

Для этого мы:

Установим Python
Создадим и активируем виртуальное окружение при помощи базовых инструментов pip и venv
В качестве примера установим библиотеки notebook и pandas
Читать полностью »

Как простые NLP модели видят слова? | NLP | Пишем свой TF-IDF

2024-08-17 в 12:15, admin, рубрики: AI, deeplearning, jupyter notebook, machinelearning, math, nlp, numpy, pandas, python, tfidfvectorizer

Как модели видят наш текст?

Когда начинаешь погружаться в сферу NLP, сразу задумываешься, как модели представляют себе наш текст/наши слова? Ведь не логично бы звучало, если модель обрабатывала наши слова, как обычную последовательность букв. Это было бы не удобно и не понятно(как проводить операции со словами?).

Есть разные методы преобразования слов. Один из самых известных для не самых сложных моделей: TF-IDF.

Как работает TF-IDF?

TF-IDF(Term Frequency-Inverse Document Frequency) — это метод, который преобразует слова в числовые векторы, что делает их более понятными для моделей машинного обучения.

Читать полностью »

10 полезных расширений для дата-сайентистов

2021-02-23 в 10:13, admin, рубрики: data science, jupyter notebook, machine learning, skillfactory, Блог компании SkillFactory, искусственный интеллект, Лайфхаки для гиков, машинное обучение, Программирование, расширения

Каждый специалист по Data Science тратит большую часть своего времени на визуализацию данных, их предварительную обработку и настройку модели на основе полученных результатов. Для каждого исследователя данных именно эти моменты – самая сложная часть процесса, поскольку хорошую модель можно получить при условии, что вы точно выполните все эти три шага. И вот 10 очень полезных расширений Jupyter Notebook, которые помогут вам выполнить эти шаги.

Читать полностью »

Эксперименты с микроконтроллерами в Jupyter Notebook

2020-03-31 в 11:41, admin, рубрики: C, c++, jupyter notebook, openocd, REMCU, stm8l, программирование микроконтроллеров, Производство и разработка электроники, Электроника для начинающих

Jupyter Notebook — любимый инструмент-среда для data scientist'ов, аналитиков, инженеров, математиков, студентов и даже для нас — самых обычных ученых в экспериментальной физике.

Этот инструмент предназначен для работы с интерпретируемыми языками и удобного графического представления данных. Долгое время мы просто считали на нем, используя Python и математические библиотеки (numpy, SciPy, matplot и т.д.). Но оказывается данная среда не так проста и имеет гораздо больший потенциал. Очень неожиданно, но Jupyter позволяет легко манипулировать электронными устройствами на микроконтроллерах, может служить чем-то вроде REPL среды для МК только без слабенького MicroPython и внушительной поддержкой переферии чипа, причем все это почти из коробки.

Эксперименты с микроконтроллерами в Jupyter Notebook - 1

Читать полностью »

Как визуализировать и анимировать (геофизические) модели

2020-03-14 в 18:41, admin, рубрики: 3d, geodata, jupyter notebook, mantaflow, paraview, pyvista, visualization, vtk, визуализация данных

Данная публикация это начало цикла статей. Если вам интересно, скажите об этом, а если не интересно, цикл на этом и закончится, тогда просто смотрите ниже список необходимого программного обеспечения и примеры.

Это не пошаговое руководство по визуализации трех- и четырехмерных данных, а подход к тому, как и чем это можно сделать и, притом, сделать качественно. Вероятно, многие из нас бывали в ситуациях, когда уже есть подготовленные с большим трудом данные, которые необходимо визуализировать, но неизвестно, как же это сделать так, чтобы не испортить все впечатление от выполненной работы. Существует много коммерческого программного обеспечения для этих целей, но мы будем рассматривать исключительно Open Source программы.

Tambora Volcano, Indonesia

Читать полностью »

Молчание вентиляторов. Google Colab, Javascript и TensorflowJS

2020-02-19 в 8:20, admin, рубрики: Google, Google Colaboratory, Hannibal Lecter, javascript, jupyter notebook, machine learning, TensorFlow, tensorflow-js, машинное обучение

Google Colab — это бесплатный облачный сервис на основе Jupyter Notebook. Google Colab предоставляет всё необходимое для машинного обучения прямо в браузере, даёт бесплатный доступ к невероятно быстрым GPU и TPU. Заранее предупрежу, что у него есть некоторые ограничения, поэтому вы не сможете использовать его для production.

С помощью Google Colab вы можете легко обучить свою модель за считанные секунды. Он поддерживает Python (2/3) из коробки, так что всё должно быть хорошо, верно?

Молчание вентиляторов. Google Colab, Javascript и TensorflowJS - 1

Читать полностью »

Добавляем в Jupyter Notebooks красоту и интерактивность

2020-01-24 в 7:13, admin, рубрики: ipython, ipywidgets, jupyter notebook, python, termcolor, Программирование

Многие используют в своей работе Jupyter Notebooks. Но с ростом сложности проекта появляются проблемы. В блокноте появляются ячейки с красными пометками для самого себя «перед запуском укажи число...» или «задай количество итераций исходя из...». Какой-то откат к командной строке получается.

Да и вывод данных на экран не всегда воспринимается без пояснений сторонним человеком, который привык к красивым таблицам, картинкам и прочим современным элементам интерфейса.
Читать полностью »

Повышение продуктивности при работе с Jupyter Notebook за 5 минут

2020-01-10 в 7:53, admin, рубрики: jupyter notebook, python, Программирование, продуктивность

Для начала повторим основные горячие клавиши. Если вы их ещё не используете — начните обязательно. В долгосрочной перспективе время на изучение окупится многократно.

0. Основные горячие клавиши

Esc: Переключение между режимом выполнения и редактирования
A: Добавление пустой ячейки сверху
B: Добавление пустой ячейки снизу
DD: Удаления ячейки
C: Копирование ячеек
X: Вырезание ячеек
V: Вставка ячеек

1. Перезапуск блокнота

Для рестарта просто нажмите ESC + 00.

Повышение продуктивности при работе с Jupyter Notebook за 5 минут - 1

Читать полностью »

Извлечение данных при машинном обучении

2019-07-19 в 12:15, admin, рубрики: big data, BigData, data mining, data science, jupyter notebook, mashine learning, python, Блог компании Plarium, дата-майнинг, машинное обучение, наука о данных, новичкам, сбор данных

Хотите узнать о трех методах получения данных для своего следующего проекта по ML? Тогда читайте перевод статьи Rebecca Vickery, опубликованной в блоге Towards Data Science на сайте Medium! Она будет интересна начинающим специалистам.

Извлечение данных при машинном обучении - 1

Получение качественных данных — это первый и наиболее важный шаг в любом проекте по машинному обучению. Специалисты Data Science часто применяют различные методы получения датасетов. Они могут использовать общедоступные данные, а также данные, доступные по API или получаемые из различных баз данных, но чаще всего комбинируют перечисленные методы.

Цель этой статьи — представить краткий обзор трех разных методов извлечения данных с использованием языка Python. Я расскажу, как делать это с помощью Jupyter Notebook. В своей предыдущей статье я писала о применении некоторых команд, запускаемых в терминале.Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Рубрика «jupyter notebook»