Адрес канала:
Категории:
Технологии
Язык: Русский
Количество подписчиков:
3.23K
Описание канала:
👋 Привет, я Дима, консультант по обучению в компании Positive Technologies и инструктор по Python.
Создаю учебные курсы по обработке данных и открытой науке.
Рекламу не размещаю.
Связаться со мной → @dm_fedorov
Рейтинги и Отзывы
Оценить канал init_python и оставить отзыв — могут только зарегестрированные пользователи. Все отзывы проходят модерацию.
5 звезд
1
4 звезд
1
3 звезд
0
2 звезд
0
1 звезд
0
Последние сообщения 2
2021-03-18 09:10:26
Подготовил обзор модуля
pandera Pandera - инструмент для
проверки фреймов данных pandas, который предоставляет интуитивно понятный, гибкий и выразительный API
Проверка статистических данных с помощью модуля pandera или в CoLab
Приятного чтения!
4.6K viewsДима Федоров, 06:10
2021-03-09 09:22:29
Подготовил обзор двух полезных модулей
Pandas Profiling - это библиотека для генерации интерактивных отчетов (по ссылке пример отчета) на основе пользовательских данных: можем увидеть распределение данных, типы, возможные проблемы. Библиотека очень проста в использовании: можем создать отчет и отправить его кому угодно!
Использование модуля Pandas Profiling для профилирования или в CoLab
Folium - это библиотека, которая позволяет рисовать карты, маркеры, а также отмечать собственные данные (по умолчанию в
OpenStreetMap)
Используем модуль folium для рисования карт или в CoLab
Остальные переводы, обзоры и кейсы по анализу данных доступны по ссылке.
5.7K viewsДима Федоров, edited 06:22
2021-03-01 09:45:19
По многочисленным просьбам подготовил перевод статьи про визуализацию в
Plotly Express Взгляд на Plotly Express.
Приятного чтения!
2.1K viewsДима Федоров, 06:45
2021-02-25 09:09:02
В 2014 году вышла знаменитая статья Хэдли Уикхэма о
Tidy Data (
аккуратных данных).
Разбираемся по ссылке, что такое
аккуратные данные с точки зрения Python и pandas Еще в качестве эксперимента собрал блокнот с примером
равновесия Нэша из теории игр, запустить его можно в CoLab по ссылке.
2.2K viewsДима Федоров, edited 06:09
2021-02-18 10:09:27
При использовании
pandas существует несколько методов
очистки текстовых полей для подготовки к дальнейшему анализу.
В новой статье показаны примеры очистки текстовых полей в большом файле и даны советы по эффективной
очистке неструктурированных текстовых полей с помощью Python и pandas
Читать Эффективная очистка текста с помощью Pandas
Запустить примеры в Colab, немного оптимизировал код для этой среды
Приятного чтения!
6.5K viewsДима Федоров, 07:09
2021-02-08 10:30:36
После
matplotlib и
seaborn для меня
Altair стал открытием
У него другая логика работы и невероятная интерактивность на основе JavaScript
Рекомендую оценить примеры и упражнения из переведенных уроков:
Введение в визуализацию данных с помощью Altair (часть 1)
Визуализация данных с помощью Altair (часть 2)
Визуализация данных с помощью Altair (часть 3)
Приятного чтения!
6.0K viewsДима Федоров, 07:30
2021-02-01 11:37:38
Сегодня разбираемся, как работать с Altair, библиотекой декларативной статистической визуализации для Python
Завершил перевод вводной части, внутри Colab и упражнения!
Приятного чтения!
2.8K viewsДима Федоров, 08:37
2021-01-25 10:39:29
Разбираемся в прогнозировании поощрительных выплат с продаж с помощью моделирования Монте-Карло
Приятного чтения!
2.2K viewsДима Федоров, 07:39
2021-01-18 08:39:19
По многочисленным просьбам подготовил переводы про визуализацию и обработку данных для ML
Эффективное использование Matplotlib
Руководство по кодированию категориальных значений в Python
Приятного чтения!
PS. остальные переводы и кейсы по ссылке
5.5K viewsДима Федоров, 05:39
2021-01-11 09:18:51
Подготовил перевод двух интересных статей для любителей покопаться в pandas
Объяснение кросс-таблицы (crosstab) в Pandas
Разделение (биннинг, дискретизация, балансировка) данных с помощью qcut и cut в Pandas
6.5K viewsДима Федоров, 06:18