Адрес канала:
Категории:
Блоги
Язык: Русский
Количество подписчиков:
4.67K
Описание канала:
Окончил МФТИ🧑🔬
ML Тимлид в DoDo 🍕
Фармлю Kaggle 🏆
Живу в Таиланде 🇹🇭
Прокачаю тебя в Data Science 🚀
Aleksandr Milenkin @Aleron
Вакансии @hiring_relocatin_hr_it
Рейтинги и Отзывы
Оценить канал datafeeling и оставить отзыв — могут только зарегестрированные пользователи. Все отзывы проходят модерацию.
5 звезд
1
4 звезд
0
3 звезд
0
2 звезд
1
1 звезд
0
Последние сообщения 4
2022-06-11 12:43:14
идея для фрод стартапа
Написать сетку, которая вместо тебя размечает данные на сервисах разметки по типу Толоки
Сегментацию, насколько знаю, сетки уже очень хорошо решают - почему бы на этом не заработать?!
U-net крутится, бабки мутятся
1.3K viewsAleron Миленькин, edited 09:43
2022-06-07 13:32:54
Наткнулся с тимой на любопытный факап модели, пока фармили чемпионат.
Бустинг опирается сильнее всего на рандомно-сгенерированные признаки при этом дает очень высокую точность ~70% accuracy для 10 классов
Это к вопросу о том, что деревья умеют находить закономерности даже в шуме. На рисунке типичный
Feature Importance.
Мдамс... дата саенс такой дата саенс...
Чтоб такого не было, используйте
Permutation Importance
1.8K viewsAleron Миленькин, edited 10:32
2022-06-05 11:50:47
Как проверить, что ты True DS?!
Если ты можешь из текстового датасета BERT'ом извлечь эмбеддинги предложений дальше пихнуть в бустинг выбить высокие метрики для задачи мульти-классификации... При этом проворачиваешь все это дело за < 30 минут , то ты красавчик
Это я вчера на летную школу в Сириус отбирался. В прошлом году мне очень понравилось.
2.1K viewsAleron Миленькин, edited 08:50
2022-06-02 12:54:49
Ауффф! Знаковый день в моей жизни!
Приняли мою научную статью в журнал уровня Q2. Первая! В прошлый жизни я был биоинформатиком ежжи . Вот доходят отголоски.
Теперь True Scientist! Теперь и на PhD будет проще попасть в долину
Тему исследования даже называть не стану, чтоб не пугать людей . Чтоб вы понимали, я трижды был вписан ранее в биологические статьи, но каждый раз что-то шло не так, и исследования стопорились . В этот раз хватило сил и удачи.
Одна из целей на год выполнена!
1.5K viewsAleron Миленькин, edited 09:54
2022-05-31 16:51:05
Работать Data Scientist’ом:
Ожидание: решаешь крутые и важные задачи, увеличивая прибыль компании. Находишь точки роста с помощью data-driven подхода и легко выявляешь «золотые гипотезы».
Реальность: отбиваешься от просьб студентов решить задачки в сессию
1.7K viewsAleron Миленькин, edited 13:51
2022-05-30 11:22:39
Ловите пушку!
Новый выпуск типичного собеседования по Data Science.
В этот раз встретились с опытным DS кандидатом и матерым хакатонщиком - Иваном из Сбера. Идеальный выпуск, чтоб посмотреть в обеденный перерыв. Ваня держался очень хорошо, но что-то пошло не так…
Кстати, после этой встречи, решили с Ваней поучаствовать совместно в ближайших чемпионатах. Посмотрим что из этого выйдет. Расскажу про совместные результаты позже.
Совместно с t.me/dzis_science
2.2K viewsAleron Миленькин, edited 08:22
2022-05-28 19:58:46
Моя аудитория напрямую влияет на жизнь моего канала!
Мы тут с Андреем спорим как следующий выпуск назвать.
Сам сюжет такой - на вход попадает 6 джунов и каждый раунд вопросов по DS мы отсеиваем одного самого слабого джуна. До этого выпуски назывались по типу _Типичное собеседование__Позиция__Результат_.
Как назвать эти выпуски? Ведь собес на 6 ждунов типичным собесом уже точно не назовешь.
Крч, кидайте/выбирайте варианты в комменты. Я выберу тот, за который больше всего проголосуют другие.
Версия Андрея - "Мы собесили 6 джунов. Они орали".
2.0K viewsАлександр (Aleron) Миленькин, edited 16:58
2022-05-26 22:12:45
Мой трехмесячный марафон фарминга подошел к концу.
Плеяда соревнований закончилась под эгидой DataFussion contest от ВТБ. В рамках основной задачи марафонцам предстояло решить проблему матчинга пользователей на основе данных о банковских транзакиях и данных о кликстриме.
Дополнительную сложность вносил лимит по времени на докер контейнер и тп. Лучшей тиме немного не хватило до призовых мест в основной задаче, но удалось взять серебро (а также 50 к и мерч) в номинации "публичное решение". В финальном решении марафонцы нагенерировали фичей, отобрали наиболее важные и на полученных векторах обучили catboost . Из прикольного, попробовали сетки и даже подход с SAX-PAA для временных рядов, но не выстрелило. В топе как всегда лютый блендинг
Следующие три месяца лучшие ребята будут фармить соревы уже на ставке в Red Mad Robot
Своими личными выводами и мыслями поделюсь позже
856 viewsАлександр (Aleron) Миленькин, edited 19:12
2022-05-26 09:45:46
Присматриваюсь к интересным вакансиям. Подумываю вот, а не сменить ли мне сферу деятельности....
Судя по 1.5М просмотров за ~7 месяцев, понимаешь, что популярно сейчас далеко не IT. Сейчас на хайпе другое
На вид профессия даже романтичнее, чем работа таксистов
1.3K viewsАлександр (Aleron) Миленькин, edited 06:45
2022-05-24 19:32:27
Продолжаю прокачивать свой тайм-менеджмент.
Теперь у меня еще больше времени на Kaggle
P.S - Х5 было одним из лучших мест, где мне приходилось тащить таски. Увы, кризис никого не щадит, так бы побыли вместе подольше.
1.5K viewsАлександр (Aleron) Миленькин, edited 16:32