Адрес канала:
Категории:
Технологии
Язык: Русский
Количество подписчиков:
16.27K
Описание канала:
Статьи на тему data science, machine learning, big data, python, математика, нейронные сети, искусственный интеллект (artificial intelligence)
По сотрудничеству - @g_abashkin
Рейтинги и Отзывы
Оценить канал devsp и оставить отзыв — могут только зарегестрированные пользователи. Все отзывы проходят модерацию.
5 звезд
1
4 звезд
0
3 звезд
0
2 звезд
0
1 звезд
1
Последние сообщения 6
2023-05-21 20:07:10
Как ускорить пилотные проекты по анализу больших данныхВ этой статье автор расскажет, с какими типовыми проблемами можно столкнуться при внедрении F5 Platform, какой инструмент нужно разработать для их преодоления, и как он помог нам ускорить проведение пилотных проектов, а также вы узнаете почему платформенное решение — это сложный ИТ‑продукт, требующий развитой инфраструктуры и квалифицированных специалистов.
Читать...
1.0K views17:07
2023-05-21 15:07:39
Clickhouse: сжимаем данные эффективноВ этой статье автор расскажет, какой есть способ оптимизации хранения данных и запросов, который поможет ускорить процесс выполнения задачи с помощью использования кодеков сжатия в колонках, и какие результаты можно получить при использовании кодеков, а также вы узнаете почему в clickhouse есть несколько алгоритмов сжатия.
Читать...
1.3K views12:07
2023-05-20 20:07:45
Как определить оптимальную подпоследовательность тем при автоматизации чатовВ этой статье автор расскажет, как автоматизируя чаты, можно снять типовые вопросы с агентов, высвобождая человеческий ресурс на действительно сложные задачи, а боту оставить рутину, и почему автоматизация чатов подразумевает целый спектр работ: обучение ML моделей новым темам, доработка функционала бота, подготовка текстов ответов их переводов и тестирование, а также вы узнаете почему автоматизация тем — очень растянутый по времени процесс.
Читать...
1.6K views17:07
2023-05-20 15:07:14
Неудачный опыт: выявление аномалий в данных методами кластеризацииВ этой статье автор расскажет, почему модель машинного обучения не может воспринимать текст в принципе, и как для визуализации результатов работы моделей можно использовать стохастическое вложение соседей с t-распределением, а также вы узнаете почему адекватные результаты показали только две модели: DBSCAN и иерархическая кластеризация.
Читать...
1.6K views12:07
2023-05-19 20:07:21
Пять причин, по которым вам нужны синтетические данныеВ этой статье автор расскажет, почему сбор и разметка данных в реальном мире может быть длительным и дорогостоящим занятием, и почему у этих данных могут быть проблемы с качеством, разнообразием и количеством, а также вы узнаете какие проблемы можно решать с помощью синтетических данных.
Читать...
1.6K views17:07
2023-05-19 15:07:30
Как упростить анализ данных с помощью использования готовой виртуальной машины для аналитикиВ этой статье автор расскажет, почему раньше для исследования данных и разработки моделей можно было выбрать один из трех путей, и как можно настроить весь набор инструментов на своем компьютере или на арендованной инфраструктуре самостоятельно, а также вы узнаете в текущих условиях работать одновременно с несколькими SaaS не всегда удобно.
Читать...
1.7K views12:07
2023-05-19 11:07:59
Часто на Hadoop-кластерах не хватает ресурсов. Когда некоторые аналитики просят огромное количество ядер и памяти для своих Jupyter-ноутбуков, другие участники вообще не могут получить ресурсы. Это очень тормозит рабочие процессы. Узнали, согласны?Александр Ледовский, тимлид команды аналитики и DS в Авито, делится опытом использования Apache Spark для работы с поисковыми логами.
Всё, что нужно знать аналитикам, дата-инженерам, специалистам по обработке больших данных и тимлидам команд, чтобы задавать параметры Spark-сессии и получать ресурсы.
Переходите и читайте по ссылке.Реклама. ООО «Авито Тех». LdtCKJT9n
1.7K views08:07
2023-05-18 20:07:37
Кто я аналитик данных или датасаентистВ этой статье автор расскажет, почему в 50% статей в интернете написано, что аналитик данных и Data Scientist это одно и тоже, а другие 50% - за абсолютную разницу данных профессий, и почему одной из ключевых задач аналитика является обработка данных, а также вы узнаете почему аналитическая работа часто предполагает работу в команде, особенно над крупным проектом, взаимодействие с другими сотрудниками, сбор информации для анализа.
Читать...
716 views17:07
2023-05-18 15:07:26
Частотный vs байесовский подходы: оцениваем True Positive Rate при неполной разметке данныхВ этой статье автор расскажет, как на основе серии проверки гипотез получить доверительный интервал, используя под капотом гипергеометрическое распределение, что будет, если скрестить биномиальное распределение с бета-распределением, и как этот гибрид используется в качестве сопряженного априорного распределения для гипергеометрического распределения, а также вы узнаете почему аналитики центра должны расследовать каждый алерт и в случае обнаружения угроз предупреждать клиентов, формируя рекомендации по устранению опасности.
Читать...
1.2K views12:07
2023-05-18 10:37:36
Специально для тех, кто всё пропустил, — напоминаем, что осталось не так много времени до конца приёма заявок в Академию Аналитиков Авито!Онлайн-программа для аналитиков данных и DS-инженеров стартует в сентябре, но успеть податься нужно до 13 июня.
На курсе с каждым студентом работает команда профессионалов — куратор, экспертные преподаватели и ментор из числа действующих опытных аналитиков или DS-инженеров Авито.
Курс будет особенно интересен студентам, но ждём всех желающих научиться чему-то новому или прокачать свои навыки. Потребуются знания мат. статистики, теории вероятностей и умением программировать на любом языке.
За подробностями ныряем по ссылке — изучаем программу и заполняем заявку.Реклама. ООО «Авито Тех». LdtCK2yB2
1.4K views07:37