Получи случайную криптовалюту за регистрацию!

Клуб CDO

Логотип телеграм канала @cdo_club — Клуб CDO К
Логотип телеграм канала @cdo_club — Клуб CDO
Адрес канала: @cdo_club
Категории: Технологии
Язык: Русский
Количество подписчиков: 2.30K
Описание канала:

Сообщество профессионалов в области работы с данными и искуственным интеллектом

Рейтинги и Отзывы

2.33

3 отзыва

Оценить канал cdo_club и оставить отзыв — могут только зарегестрированные пользователи. Все отзывы проходят модерацию.

5 звезд

0

4 звезд

0

3 звезд

1

2 звезд

2

1 звезд

0


Последние сообщения

2022-08-31 19:20:09 Я уже отмечал, что blockchain в применении к хранению и обработки данных считаю довольно интересной перспективой. Тем нее менее мы пока только в самом начале экспериментов в этой области. И вот как показывает автор статьи ниже, пока с децентрализованными хранилищами не все так хорошо, в первую очередь по причини низкого спроса и популярности таких сервисов. Но думаю, что все еще впереди.

https://habr.com/ru/company/first/blog/682540/
215 viewsPostoplanBot, 16:20
Открыть/Комментировать
2022-08-31 14:05:10 Разработка рекомендательных систем - одна из наиболее распространённых практик применения данных, к тому же с доказанным эффектом для бизнеса. Поэтому я особо отмечаю такие статьи и кейсы. Тем более, что разработка таких систем сопряжена и с работой с большим объемом данных, объединением данных из различных источников как внутри компаний, так и от внешних поставщиков и с применением самых передовых методов анализа данных и ML. Вот очередной кейс:

https://habr.com/ru/company/agima/blog/683888/
352 viewsPostoplanBot, 11:05
Открыть/Комментировать
2022-08-31 09:40:09 Немного подробностей про нашу новую возможность разделения спикеров, которую наша команда реализовала в платформе генерации и распознавания речи SmartSpeech.

Надеюсь будет интересно почитать

https://habr.com/ru/company/sberdevices/blog/684228/
409 viewsPostoplanBot, 06:40
Открыть/Комментировать
2022-08-30 18:55:14 Очень много подробностей про Data центр Google. И много фоток :)

Несколько интересных моментов из статьи:
- На строительство собственного дата-центра в Дугласе Google потратил 1,2 миллиарда долларов, создав около 500 рабочих мест для его дальнейшего обслуживания.
- Для уменьшение нагрузки на естественное водоснабжение округа часть воды забирается из сточных вод Дугласа
- дата-центры потребляют до 1,5% всей электроэнергии в мире
- Дата-центр в Южной Каролине один из самый дорогих и нестандартных ЦОД компании. Чтобы уменьшить нагрузку на водоснабжение округа Google собирает дождевую воду в небольшой пруд и использует ее в системе охлаждения.
- Для очищения водоема от цветущих водорослей компания экспериментировала с «телапией» — пресноводной рыбой, питающейся водными растениями.
- Особенность ЦОДа в Тайване в том, что он аккумулирует ночную электроэнергию в холодных батареях со льдом или хладагентом, после чего использует ее днем для охлаждения серверов.
- Официальных данных о том, сколько серверов находится в распоряжении Google нет. По предположениям Gartner, компании технологических исследований, на момент 2016 года Google владела 2,5 миллионами серверов
- В 2011 году произошел крупный сбой Gmail. Потерянные письма 40 000 пользователей были восстановлены из ленточных библиотек Oracle StreamLine 8500 с использованием дисков Linear Tape-Open (LTO). Google использует ленточные накопители для создания резервных копий
- Компания утверждает о существовании 6 уровней безопасности, которые направлены на защиту пользовательских данных и сокрытие определенных технологических решений компании.


https://habr.com/ru/company/first/blog/683926/
461 viewsPostoplanBot, 15:55
Открыть/Комментировать
2022-08-30 13:46:10 Если вы сталкивались с отображением большого объема данных в интерфейсе пользователя - то будет полезно почитать эту статью. С одной стороны материал немного не про Data Management, а про разработку, тем нее менее вопрос довольно актуальный для работы с большими объемами данных.

https://habr.com/ru/company/oleg-bunin/blog/678202/
424 viewsPostoplanBot, 10:46
Открыть/Комментировать
2022-08-30 11:01:36 А на следующей неделе, у нас будет в каком-то смысле продолжение и расширение темы A/B, а именно 7 сентября планируем собраться на очный митап по теме Causal Inference

Темы и спикеры:

Введение в методы Causal Inference
Полина Окунева, Наталья Тоганова, Эксперты команды Advanced Analytics в GlowByte

Кейс применения Synthetic Control для оценки инициатив
Артем Александрин, Дата аналитик мобильного приложения “Моя Москва”

Дискуссия: “за”, “против”, а также сложности и причины сомнений в Causal Inference
Упомянутые выше докладчики, а также:
Ирина Голощапова, Head of Data Science, Лента
Александр Толмачев, Head of Analytics Ozon.Fintech
Антон Григорьев, Руководитель службы аналитических инструментов Яндекс Доставки

Сбор гостей в 17:30.

На этот раз мы решили облегчить организацию митапа, подумали, что лучше будем делать проще но чаще)
Собираемся в пространстве для проведения мероприятий в офисе GlowByte, там очень уютно, но ограничено количество мест Так что спешите зарегистрироваться, после достижения определенного количества желающих, регистрация будет очень резко вырублена
Ссылка на форму для регистрации тут

Онлайн трансляции не будет, но будет запись
Запись появится в нашем канале спустя пару дней, так что если вы точно не можете поучаствовать очно, регистрироваться не надо:)

После докладов нас как обычно ждет небольшой фуршет и неформальное общение
211 viewsDenis Afanasev, 08:01
Открыть/Комментировать
2022-08-30 11:01:35 Коллеги, обратите внимание на мероприятие
243 viewsDenis Afanasev, 08:01
Открыть/Комментировать
2022-08-30 09:20:10 В копилку полезностей - нашел новый сервис для чтения RSS (ранее пользовался feedly) "Inoreader". Очень приятный интерфейс, удобно читать ленты (слева лента, справа открывается статья), удобное управление папками/подписками, а самое главное - можно читать не только RSS, но и подписываться на:

- Telegram каналы (вообще мега фича, потому что в телеге сложно делать "отложить на потом")
- Почтовые рассылки
- Youtube каналы
- Twitter ленты
- Facebook страницы
- Reddit обсуждения
и тп

В общем прям все что можно в одном месте

https://www.inoreader.com/
325 viewsPostoplanBot, 06:20
Открыть/Комментировать
2022-08-29 18:10:09 Вышла новая статья на тему распределенного обучения: Federated disentangled representation learning for unsupervised brain anomaly detection

https://www.nature.com/articles/s42256-022-00515-2
407 viewsPostoplanBot, 15:10
Открыть/Комментировать
2022-08-29 15:59:12 У ребят из Datafold еще в июле вышла прекрасная статья - https://is.gd/l4oNaY. Основной фокус в статье можно описать одним предложением: *Rather than building systems that detect and alert on breakages, build systems that don’t break.*

Observability это хорошо, очень хорошо. Но если вы в день видите 24 уведомления о том, что у вас кривые данные, весь ваш день будет потрачен на то, чтобы эти кривые данные поправить. Так может стоит инвестировать в то, чтобы строить то, что не ломается? Например, тесты, data lineage, data diff. Про это в статье как раз речь.

Мы имеем свойство переоценивать количество проблем с данными, которые приходят снаружи, и существенно недооцениваем количество наших собственных косяков. Основные драйверы этой проблемы

1. Данные это сложно – чтобы писать нормальный код, нужно знать очень многое про модель и про то, какие данные туда приходят, как они туда приходят, какое распределение у них и так далее.
2. Нам еще и бизнес-логики туда накрутили - SQL в тыщу строк? Легко!
3. Поставщики данных не спят и развиваются - платформы данных должны успевать за всеми изменениями поставщиков данных, а их много и они развиваются с огромной скоростью. Нас ждать не будут.
4. Быстрее, быстрее, быстрее!  - стейкхолдеры ждут свои дашборды, чтобы принимать решения. Тут все старо как мир.

Статью советую взглянуть, вещи хоть и относительно простые и очевидные написаны, но очень важные.

P.S. Datafold делает тулзу для DQ и опытный человек мог заметить UTM-ссылку, можно сказать, что я аффилирован! Опять же, мне никто за это не платит, с ребятами я знаком давно и лично, когда-то, даже, когда их было всего 5-7 человек, мы с ними поработали вместе несколько месяцев. Мне нравится, что и как они делают. Глеб, привет!

@ohmydataengineer
406 viewsDenis Afanasev, 12:59
Открыть/Комментировать