Получи случайную криптовалюту за регистрацию!

мамкин Data Scientist

Логотип телеграм канала @mommyscience — мамкин Data Scientist М
Логотип телеграм канала @mommyscience — мамкин Data Scientist
Адрес канала: @mommyscience
Категории: Технологии
Язык: Русский
Страна: Россия
Количество подписчиков: 8.04K
Описание канала:

тернистый путь в data science, личный экспирианс
Ваш мамкин дата сайнтист @BoykoAA

Рейтинги и Отзывы

2.33

3 отзыва

Оценить канал mommyscience и оставить отзыв — могут только зарегестрированные пользователи. Все отзывы проходят модерацию.

5 звезд

0

4 звезд

0

3 звезд

2

2 звезд

0

1 звезд

1


Последние сообщения

2020-12-15 18:00:40 ​​Бонджорно, сучары

Нужны ли алгоритмы и структуры данных Data Scientist-у. Тема очень интересная, но вот только какая разница, если тебя уже пятый собес подряд опрокидывают через huy вопросом про бинпоиск? Хочешь жить — умей вертеться, на интервью придется конкурировать с чуваками, которые перекатывается в ДС из разработки, они на память могут написать больше сортировок, чем тебе давали за всю жизнь (>=1)

Но не все так плохо. У нас уже есть пара ресурсов, писал о них раньше. Но нет структуры. Проведя соц опрос среди людей, которые дрючат таких как ты в маленьких переговорах, выделил основные темы и подобрал под них соответствующие задачи.

Табличка еще неполная, будет дополняться со временем. Правда с выходом киберпанка это может затянуться, пацаны. Пробежимся по содержанию.

Топ-4 любимых темы на собесах:
1. Поиск
2. Сортировка
3. Стек
4. Динамика

С поиском и сортировкой все понятно, а вот как же, блять, они обожают стек и всякие строчные алгоритмы с ним, это отдельная история. Хлебом не корми, дай скобочную последовательность спросить. Тут надо быть особенно внимательным. С динамикой тоже все понятно, неспособность решить простую задачку будет характеризовать тебя как ебанько 80 левела.

Пока что все оформлено топорно — в виде Гугл таблицы с названием задач и ссылками на литкод, информацикс, хакерранк. Дальше придумаю как это пиздато прикрутить к нашему сервису interview-mds.ru. Таблица будет расширяться, это не все даже базовые темы, в ближайшее время добавлю задачи на связные списки и хэш-таблицы.

Чек-лист алгоритмов → https://docs.google.com/spreadsheets/d/1kFhOcB5vO8p4TOgxZO_szfO9V-lPCCt6RKIixukGTvc/edit?usp=sharing

Это не просто задачи с потолка, а то, что реально дают на позицию ДС/МЛ.

Хватит ныть про ненужность алгоритмов для ДС, просто ебашь.

Работаем, братва
11.6K views15:00
Открыть/Комментировать
2020-11-02 18:01:16 ​​Здорова, бандиты

Сколько раз нужно подкинуть монетку, чтобы выпало два орла подряд? Не знаешь? А сколько анальных шариков влезает в Боинг 737? Тоже нет? Ну все, начальник отдела задетектил тебя как тупое быдло.

Задачи такого рода имеют много названий, мы будем называть их брейнтизерами. Такое очень любят спросить на финальных этапах отбора, когда базар идет уже с руководителем. Пару примеров на русском можно найти тут.

Короче, давай по факту. Стоит ли основательно готовиться к подобным вещам? Нет.
Если ты tupoy и не можешь с ходу решать такие штуки, то для тебя есть тру вей, как не лохануться на собесе. Погнали.

1. Не молчи. Самый плохой расклад — это молчать или еще хуже сказать: «Я не знаю». Спиздани хоть что-то умное.

2. Хорошая новость заключается в том, что типов брейнтизеров ограниченное количество. Типовые головоломки внутри себя имеют плюс-минус похожее решение. Большую часть конструкторов, по которым собираются брейнтизеры, можно найти вот тут.

Конструкторы → https://www.themuse.com/advice/7-insane-brain-teasers-you-could-actually-encounter-in-an-interview

3. Также есть куча книг, где описывается как решать подобные задачи, но нам че делать нехуй, читать литературу про фасовку анальных шариков в самолеты? Мы сделаем вот как, подписываемся на два ютуб канала и смотрим новые видосы, как только они выходят.
Первый — про классические головоломки
Второй — про числовые задачки

Первый → https://www.youtube.com/c/LOGICALLYYOURS
Второй → https://www.youtube.com/user/MindYourDecisions

Все. Следуя трем несложным пунктам, станешь королем брейнтизеров, а интервьюер будет думать, что перед ним интеллектуал, но на самом деле тот же бродяга, только подготовленный.

Подготовка — 80% успеха, работаем, братва.
14.6K views15:01
Открыть/Комментировать
2020-10-05 12:01:01 ​​Здорова, бродяги

Сидим мы как-то с Толей Карповым, пьем пивчанское, базарим, тут он говорит.
- Саня, запускаю курс по аналитике, сделали огонь, обмолвись в канале парой слов.
- Не могу, Толян, правила для всех одинаковые, что не смотрел, то не рекомендую.

Ну Толя парень простой, взял и подписал на первый поток специализации по Аналитике данных. И вот, блять, спустя 5 месяцев писания SQL запросов и проведения A/B тестов, я готов, замолвить словечко.

Для начала обозначу, что этот курс не про Data science, а про Аналитику. Если ты хочешь быть именно аналитиком, то ок, если ресечером в лабе, то Воронцов в роли доминантрикс ждет тебя на ютубе.

Толя реально понимает для кого сделал этот курс и прекрасно помнит первую неделю работы ВКонтакте, поэтому курс практически имитирует реальную деятельность аналитика и покрывает сложности первых задач, прилетающих от тимлида.

Если ты tupoy или только вкатываешься в профессию, то это однозначно твой вариант.

Ладно, хорош пиздеть, давай по делу. Пять месяцев ты будешь слушать следующие темы: Python с нуля, но сразу ориентированный на аналитику данных, SQL с нуля, Git c нуля, Airflow, Статистика, A/B тесты, Продуктовая аналитика и софт-скилл. Может быть даже додиком перестанешь быть, а то и с бабой познакомишься. Каждая из этих тем приправлена живым разбором сложных моментов, а также мини-проектом, симулирующим(как твоя девушка) реальную работу.

Плюс за бокалом роскошной Балтики 9, Толян дал промокод: MAMKINDS, на скидку 5к. Так что если твой путь лежит в аналитику с нуля, то залетай, у ребят новый набор.

Промокод → MAMKINDS
Курс → Аналитика данных

Работаем, братва
15.8K viewsedited  09:01
Открыть/Комментировать
2020-09-22 18:00:57 ​​Здорова, бандиты

Стал замечать рост вакансий связанных с временными рядами, особенно радует интерес корпораций к стажерам на это направление. Тайм сириасы одно из немногих направлений, где МЛ не притянут за huy, перфоманс там реально есть.

Вот только у нубов есть одна критическая ошибка, они пытаются заботать SOTA результаты в области, не сформировав твердую базу. Пусть то временные ряды или другая подобласть МЛ.

Братан, когда приходишь на стажера/джуна, выглядит как минимум стремно слушать про Diffusion Convolutional Recurrent Neural Network и при этом видеть удивленное ebalo при просьбе рассказать идею heapsort.

На какое бы направление МЛ ты не шел, нужно знать следующие вещи:
1. База по алгоритмам
2. База по теор.веру/статам
3. База по классическому МЛ
4. База по направлению. База блять, понял?

Базу по Тайм сириасам можно получить на семидневном мини-курсе. Он покрывает все основные моменты, которые могут спросить джуна/стажера.

Курс → https://machinelearningmastery.com/time-series-forecasting-python-mini-course/

Либо, можно совместить приятное с полезным и выполняя третий пункт из списка, взять спецуху от Яндекса/МФТИ, где на пятом курсе рассказывают основы анализа временных рядов, этого будет достаточно для старта. Можно также посмотреть отдельно эту часть специализации.

Курс → https://www.coursera.org/learn/data-analysis-applications

Первые три пункта можно подобрать под себя в первой и второй частях закрепа. Тут главное понять, что основной упор интервьюера будет направлен именно на них. Ну и, конечно, сверху все нужно шлифануть вопросами с сервиса, который мы сделали общими усилиями мамкиных ДСов.

Вопросы с собесов → https://interview-mds.ru/

А если тайм сириас для тебя рабочая рутина, то следующий продукт порадует. Четыре недели временных рядов на TensorFlow от deeplearning.ai. Тут и DNN, и RNN, все как мы любим. Ведущий — дядька из Google Brain, не предложит выбор из двух стульев, а посадит на каждый из них по очереди. Короче 10 из 10.

Курс → https://www.coursera.org/professional-certificates/tensorflow-in-practice

Работаем, братва
15.4K views15:00
Открыть/Комментировать
2020-08-24 18:00:57 ​​Здорова, пацаны

Сегодня будет тема для ученных в говне моченых (работяги вышли из чата). Короче, если в вакансии на которую ты подаешься есть слова типа scientist, или, если с противоположным полом совсем плохо, то можно увидеть даже researcher. Тут исход один. Рано или поздно тебя попросят либо реализовать научную статью целиком, либо какую-то часть, либо же вообще улучшить результат. Чтобы при такой просьбе тебя не перекосоебило, надо понимать следующие вещи.

Первое. Хоть сначала кажется, что некоторые статьи написаны чужими для хищников, это не так. Тут дело практики, как и в любом деле, если читать по 5-10 статей в неделю, то будешь расчехлять их за O(1).

Второе. Если не понимаешь статью от слова совсем, скорей всего проблема в статье. Ты, конечно, tupoy, но иногда поиск хорошей статьи по теме превращается в настоящий челендж. Так что если не понимаешь, забиваешь, идешь дальше.

Третье. Исследовательские статьи не только для PhD MIT. Ты можешь точно так же читать статьи и абсолютно не бояться этого. Там есть определённый формальный язык, но когда к нему привыкаешь, то читаешь как ленту новостей.

Лан, хорош пиздеть, теперь по ресурсам. Определенного алгоритма у меня нет. Но можно почитать, что говорят другие люди
https://www.sciencemag.org/careers/2016/03/how-seriously-read-scientific-paper

Начать поиск статей лучше всего здесь, думаю и так знаешь.
Google scholar → https://scholar.google.com/
Также не забывай искать на гитхабе по названию статьи, иногда можно найти хороший код.

А вот, что порекомендовал бы к просмотру, так это как 4хГрандмастер каггла (это не шарагу закончить), реализует классический U-Net. Из этого видео понятно, что если статья хорошая, то она и реализуется просто. Что написано, то и кодим. Обязательно к просмотру.
Implementing original U-Net →



Работаем, братва
16.2K views15:00
Открыть/Комментировать
2020-07-28 18:01:58 ​​Здорова, бандиты

Если бы мне платили 1$ за каждый вопрос: «А можно изучать математику не по разным источникам, а найти один, где бы была Математика для МЛ», то я бы нихуя не заработал, но было бы приятно. Ответ очень простой, да, такие есть. Слышал у физтеха есть такой курс, у степика что-то там разрабатывается и еще пару контор. Но давайте проясним пару вещей. Ты, конечно, tupoy и не понимаешь этого, но математика для МЛ ничем не отличается от Математики для экзамена на втором курсе (вот это поворот). Все темы известны, никаких секретов, информация в свободном доступе уже миллион лет.

Смоделируем две ситуации.
Первая, ты смотришь курс математика для МЛ до того, как изучил МЛ/ДС. Ну тогда какая нахрен разница, что собственные векторы используются в PCA, если ты не понимаешь что такое PCA, а если даже понимаешь, то не понимаешь сути как это работает в МЛ и зачем. С таким же успехом можешь просто прогнать все эти темы, без уклона на МЛ/ДС и никакой разницы не почувствуешь.
Вторая ситуация, ты смотришь подобный курс после того, как изучил МЛ и просто хочешь понять более детально как это все работает. Ну тогда зачем использовать подобный продукт, если ты уже и так понимаешь какие темы там под капотом, посмотри сразу их.

Хоть смысла, кроме как мотивационного пинка, в подобном продукте я не вижу, давайте сделаем вот как, есть один неплохой бесплатный курс математика для МЛ на английском. Там 26 видео в среднем по часу, как раз можно понять, каким темам нужно уделить особое внимание, выстроить программу именно под себя и охуительно заботать. Либо просто следовать пайплайнам из закрепа. Тяжело? Легко никто не обещал, 300кк/сек просто так не платят.

Курс → https://www.youtube.com/playlist?list=PL7y-1rk2cCsAqRtWoZ95z-GMcecVG5mzA

Работаем, братва
14.0K views15:01
Открыть/Комментировать
2020-07-06 18:14:13 ​​Давай по новой, Миша. Всё хуйня!

Короче, бандиты, я полностью пересмотрел смысл и содержание закреплённого поста. Теперь там собраны основные пайплайны обучения, некоторые советы, а также обновлена навигация по каналу. У нас с вами тут уже целая эко мать ее система на минималках. Будь внимателен, закреп большой, поэтому он в двух частях, друг под другом.

Важно вот что понять. Курсов много, хочется все посмотреть, но буст, который ты получаешь от практики aka Галеры, гораздо сильнее, чем от любого курса. Старайся получить хорошую базу, которая описывается в пайплайнах, а затем сразу садиться за весла. На практике люди залетают на работу даже без знания DL, а потом уже доучивают его в процессе. В этом деле главное не ссать и пробовать свои силы при каждой возможности.

Смотрим закреп, если есть новые идеи, смело пишем @BoykoAA

Закреп → https://t.me/mommyscience/14

Работаем, братва
12.8K viewsedited  15:14
Открыть/Комментировать
2020-06-10 18:01:39 ​​Бонджорно, сучары

Количество мамкиных ДСов на рынке работорговли растет по экспоненте, поэтому растут и требования к ним. Иногда встречаю вакансии джунов и диву даюсь. Думаю, ебать че навыдумывали. Это конечно не значит, что надо на все забить. Это значит, что надо быть гибким и уметь подстраиваться под изменяющейся рынок. Тем более, что там больше слов, чем дела.

Короче тема такая, допустим ты обучил модельку в джупитер ноутбуке, и она даже отличает кошу от собаки лучше твоего бухого соседа. Что делать дальше? Дальше нужно деплоить. А вот как это делать и есть новый тренд у работодателей. Да и вообще, способность завести свою модельку где-то кроме джупитера, сделать ей веб-морду и тд, крайне полезный скил для самого себя.

Научиться этому есть два способа. Путь мамкиного ДСа и нормальный.
К первому относится схема «решаем проблему по мере ее поступления». На ютубе есть отличный не то чтобы по вкусу курс, но по сути курс. Представляет собой скорей практическое руководство, которое может по шагам показать как делается деплой. Не надо бежать смотреть это с отрывом от реальной задачи, один хрен у тебя память как у рыбы, забудешь все послезавтра. Когда появится такая задача, тогда и посмотришь. Как говорится, в резюме пишем, ссылку запоминаем.

Руководство → https://www.youtube.com/playlist?list=PLQJ7ptkRY-xYLEAC5Y_sKqrJ9RA-U7Dja

Если ты больной на голову, то есть и фундаментальный вариант. Это целый курс на Udemy. Конечно, он эффективней, но надо понимать, что это целая история, и затянется она не на 2 вечера. Оверкильный вариант, но есть такие додики, которым нужен везде основательный подход, поэтому решать тебе

Курс → https://www.udemy.com/course/learn-devops-the-complete-kubernetes-course/

Идем до конца. Работаем, братва
14.5K views15:01
Открыть/Комментировать
2020-05-20 12:02:05 ​​Здорова, бандиты

Ситуация: на собеседовании интервьюер вскользь задевает командную строку, интересуясь о твоих познаниях и опыту работы с этим инструментом. Конечно же с ехидной улыбкой отвечаешь, что все в порядке, а сам на деле ты ебанько подай патроны и никогда в жизни что-то круче чем $mkdir bigtits не делал. Исправляем ситуацию.

Вообще командной строке посвящают какое-то время на нормальных CS специальностях в универе, но какую шарагу ты закончил мы знаем, поэтому надо взять что-то со стороны.
MIT любезно поделились своим курсом и домашками, которые полностью покроют потребности в командой строке при трудоустройстве. Да и стыдно знать МЛ, но не уметь пользоваться шеллом.
Тут 11 лекций и столько же домашек. Это не рокет сайнс, пацаны, поэтому все можно схавать за неделю не напрягаясь.

Shell MIT → https://missing.csail.mit.edu/

Второе, про что хочется сказать это SQL. Еще ничего так легко не понижало стоимость мамкиного DSа на рынке как эта сучка. Но тут больше разговоров, просто берем и задрачиваем. Уже сделали кучу тренажеров, которые требует только твоего времени. И если до сих пор не знаешь SQL, то посвяти блять вечера тренажерам, а не новым сезонам очередной параши.
Вот что рекомендую. Можно взять бесплатный тренажер на степике: 4 блока, 20 часов на изучение, стильно, модно, молодежно.

Тренажер степик → https://stepik.org/course/63054/promo

А можно взять sqlzoo, общепризнанного фаворита. Попробуй оба варианта, какой ближе ляжет тот и проходи. В любом случае результат будет хороший

sqlzoo → https://sqlzoo.net/

Выполнив эти 2 простых пункта ты повысишь свою стоимость, увеличишь покрытие вакансий, а главное сделаешь наконец, то что давно хотел.

Работаем, братва
13.2K views09:02
Открыть/Комментировать
2020-04-29 12:01:41 ​​Здорова, пацаны

Короче тема такая, каждое второе сообщение у меня в личке, это что-то вроде: «хорош ли курс %name%». Это отличный вопрос, обязательно напишите мне или кому-то типа меня перед тем как покупать курс за хуево-тутуево кэша.
Но вот в чем дело, я никогда не посоветую курс, который сам хотя бы не смотрел, а они плодятся со скоростью света. В таких ситуациях, советую взять что-то проверенное. Потому что база у МЛ одна, ничего сверхъестественного там не расскажут.
Конечно иногда на меня накатывает волна филантропии, тогда я даю шанс непроверенным продуктам (как ты в ашане) и покупаю их. Но пока что меня ждал сплошной пиздец.
Тем более, у нас уже выделено 3 программы по классик МЛ, которые с головой покрывают базовый объем информации, как теоретической, так и практической, за них могу ручаться: спецуха, одс, институт биоинформатики + одс.

А сегодня к этой тройке добавляется, прямо-таки неебовый конкурент. Свежий курс от физтеха. Причем в двух вариациях: базовый уровень и продвинутый. Базовый уровень — это ровно тот курс лекций и домашек, который прослушивают студенты физтеха на третьем курсе, а продвинутый на четвертом.

Пару слов. Это абсолютно самостоятельный продукт, его не нужно дополнять какой-то дополнительной домашкой или лекциями, если конечно бекграунд соответствует. Просмотрев базовую версию и выполнив 80% домашек, а также докинув сюда 1-2 соревнования на Kaggle, ты будешь готов ебать мозги всей Москве и мозолить глаза hr-ам разных компаний.

Быстро по структуре. Сюрпризов не будет, все по классике. 13 недель. Линейные модели, деревья, бустинги, хуюстинги, немного нейронок.

Что касается продвинутого курса, оно того стоит, пацаны, смотрим. Некоторые ноутбуки даже просто прощелкать будет полезно. Короче мастхев. Просто глянь список лекций, возможно прослушать 1-2 будет самый сок для тебя, а не проходить весь курс.

По нашей стандартной метрике тобi пiзда / качество — 9/10 для базового, из-за достаточно высокого порога входа. И 10/10 для продвинутого, тут люди к боли привыкшие.

Курсы → https://github.com/ml-mipt/ml-mipt

Ботаем, братва
13.5K views09:01
Открыть/Комментировать