Dan Okhlopkov - канал

Адрес канала:

Категории: Блоги

Язык: Русский

Количество подписчиков: 8.90K

Описание канала:

а кто этот твой друг русский хакер, поднявший деньги от наваля
okhlopkov.com

▲ Vote (1)

Рейтинги и Отзывы

1.00

2 отзыва

Оценить канал danokhlopkov и оставить отзыв — могут только зарегестрированные пользователи. Все отзывы проходят модерацию.

5 звезд

4 звезд

3 звезд

2 звезд

1 звезд

Последние сообщения 49

2021-04-12 19:29:24 я выступаю через час есчо

399 views16:29

Открыть/Комментировать

2021-04-12 19:25:04

Мой доклад будет поверхностным и быстрым - я просто вкину технологии, которые помогут вам быстро собрать Data Platform для вашего проекта. Будет максимально приближено к практике, но самому погуглить детали нужно anyway.

Для маленьких стартапов, для маленьких данных, для будущих CTO.

449 viewsedited 16:25

Открыть/Комментировать

2021-04-12 13:00:16 Каггл и корпорации извратили нас, предлагая готовые датасеты для анализа. А собирать их кто будет? Где хранить и как предоставить доступ для аналитиков и пацанам из бизнеса?

Сегодня где-то после 20:00 расскажу, как дешево сделать платформу по сбору, хранению и анализу данных для вашего стартапа. Не биг-бигдата, но для ~1Тб данных подойдет. Ссылочка.

489 views10:00

Открыть/Комментировать

2021-04-09 14:28:01 ETL vs. ELT

До меня только недавно дошло, что такое ELT и зачем. Раньше я думал, что это опечатка или прикол а-ля HODL. Но нет.

Когда ты дата инженер, тебе нужно перетаскивать данные из одного места в другое. Бывает, что ты добавляешь новый источник данных в свой Data Lake (например, начинаешь парсить что-то).

Так вот, в этом случае правильным и масштабируемым подходом будет ELT (extract-load-transform), а не ETL (extract-transform-load). Лучше сохранять максимально сырые данные (+ timestamp), а потом отдельной таской переводить их в нужный формат в новую таблицу.

Да, занимает больше места (хранение сырых и обработанных данных), дольше прогать (нужно писать скрипт, форматирующий данные). Но в будущем, когда окажется, что нужно было что-то ещё сохранять или форматирование было ошибочное, вы всегда сможете все переделать без потерь данных, так как у вас сохранены исходники.

554 views11:28

Открыть/Комментировать

2021-04-06 11:49:12 SQL + Python = Сила

1.1K views08:49

Открыть/Комментировать

2021-04-05 12:31:30 Квест

1) Расклеиваем QR коды в городе
2) Коды - одноразовые
3) Первому выдается NFT токен с местом
4) Заводим комьюнити, кидаем туда подсказки
5) Заводим сайт с картой, лидербордом и тп.

1.3K views09:31

Открыть/Комментировать

2021-04-05 09:47:01 Раз я люблю парсить открытые данные (кстати не факт, что это все еще можно делать), у меня была идея сделать поисковик по людям.

Формально просто парсить профили людей в разных соцсетях (Instagram, Facebook, Twittter, Linkedin, Telegram, Github). Объединять профили из разных соцсетей в одного человека. По UGC определять интересы, связи с другими людьми, демографию и гео. Внутри сервиса предлагать поиск по этим фильтрам, а на выходе давать ссылки на соцсети.

Такая вот read-only соцсеть получается. Начать можно с айтишников, так как о них можно больше инфы нарыть.

395 views06:47

Открыть/Комментировать

2021-04-01 15:50:00 Местоположение всех нод Ethereum (~4300 штук)

707 views12:50

Открыть/Комментировать

2021-04-01 14:55:44 Местоположение всех биткойн нод (~8800 штук)

793 viewsedited 11:55

Открыть/Комментировать