Получи случайную криптовалюту за регистрацию!

Python для анализа данных

Логотип телеграм канала @init_python — Python для анализа данных P
Логотип телеграм канала @init_python — Python для анализа данных
Адрес канала: @init_python
Категории: Технологии
Язык: Русский
Количество подписчиков: 3.23K
Описание канала:

👋 Привет, я Дима, консультант по обучению в компании Positive Technologies и инструктор по Python.
Создаю учебные курсы по обработке данных и открытой науке.
Рекламу не размещаю.
Связаться со мной → @dm_fedorov

Рейтинги и Отзывы

4.50

2 отзыва

Оценить канал init_python и оставить отзыв — могут только зарегестрированные пользователи. Все отзывы проходят модерацию.

5 звезд

1

4 звезд

1

3 звезд

0

2 звезд

0

1 звезд

0


Последние сообщения 2

2021-03-18 09:10:26 Подготовил обзор модуля pandera

Pandera - инструмент для проверки фреймов данных pandas, который предоставляет интуитивно понятный, гибкий и выразительный API

Проверка статистических данных с помощью модуля pandera или в CoLab

Приятного чтения!
4.6K viewsДима Федоров, 06:10
Открыть/Комментировать
2021-03-09 09:22:29 Подготовил обзор двух полезных модулей

Pandas Profiling - это библиотека для генерации интерактивных отчетов (по ссылке пример отчета) на основе пользовательских данных: можем увидеть распределение данных, типы, возможные проблемы. Библиотека очень проста в использовании: можем создать отчет и отправить его кому угодно!

Использование модуля Pandas Profiling для профилирования или в CoLab

Folium - это библиотека, которая позволяет рисовать карты, маркеры, а также отмечать собственные данные (по умолчанию в OpenStreetMap)

Используем модуль folium для рисования карт или в CoLab

Остальные переводы, обзоры и кейсы по анализу данных доступны по ссылке.
5.7K viewsДима Федоров, edited  06:22
Открыть/Комментировать
2021-03-01 09:45:19 По многочисленным просьбам подготовил перевод статьи про визуализацию в Plotly Express

Взгляд на Plotly Express.

Приятного чтения!
2.1K viewsДима Федоров, 06:45
Открыть/Комментировать
2021-02-25 09:09:02 В 2014 году вышла знаменитая статья Хэдли Уикхэма о Tidy Data (аккуратных данных).
Разбираемся по ссылке, что такое аккуратные данные с точки зрения Python и pandas

Еще в качестве эксперимента собрал блокнот с примером равновесия Нэша из теории игр, запустить его можно в CoLab по ссылке.
2.2K viewsДима Федоров, edited  06:09
Открыть/Комментировать
2021-02-18 10:09:27 При использовании pandas существует несколько методов очистки текстовых полей для подготовки к дальнейшему анализу.
В новой статье показаны примеры очистки текстовых полей в большом файле и даны советы по эффективной очистке неструктурированных текстовых полей с помощью Python и pandas

Читать Эффективная очистка текста с помощью Pandas

Запустить примеры в Colab, немного оптимизировал код для этой среды

Приятного чтения!
6.5K viewsДима Федоров, 07:09
Открыть/Комментировать
2021-02-08 10:30:36 После matplotlib и seaborn для меня Altair стал открытием
У него другая логика работы и невероятная интерактивность на основе JavaScript

Рекомендую оценить примеры и упражнения из переведенных уроков:

Введение в визуализацию данных с помощью Altair (часть 1)

Визуализация данных с помощью Altair (часть 2)

Визуализация данных с помощью Altair (часть 3)

Приятного чтения!
6.0K viewsДима Федоров, 07:30
Открыть/Комментировать
2021-02-01 11:37:38 Сегодня разбираемся, как работать с Altair, библиотекой декларативной статистической визуализации для Python

Завершил перевод вводной части, внутри Colab и упражнения!

Приятного чтения!
2.8K viewsДима Федоров, 08:37
Открыть/Комментировать
2021-01-25 10:39:29 Разбираемся в прогнозировании поощрительных выплат с продаж с помощью моделирования Монте-Карло

Приятного чтения!
2.2K viewsДима Федоров, 07:39
Открыть/Комментировать
2021-01-18 08:39:19 По многочисленным просьбам подготовил переводы про визуализацию и обработку данных для ML

Эффективное использование Matplotlib

Руководство по кодированию категориальных значений в Python

Приятного чтения!

PS. остальные переводы и кейсы по ссылке
5.5K viewsДима Федоров, 05:39
Открыть/Комментировать
2021-01-11 09:18:51 Подготовил перевод двух интересных статей для любителей покопаться в pandas

Объяснение кросс-таблицы (crosstab) в Pandas

Разделение (биннинг, дискретизация, балансировка) данных с помощью qcut и cut в Pandas
6.5K viewsДима Федоров, 06:18
Открыть/Комментировать