Получи случайную криптовалюту за регистрацию!

'Новая активность - соревнования.' В дата сайнс комьюнити все | NanoBioSmartLab

"Новая активность - соревнования." В дата сайнс комьюнити все знают, что один из лучших способов учиться дата сайнс - принимать участие в соревнованиях на Каггл. Мы открываем новый чат https://t.me/sberlogacompete - посвященный любым соревнованиям по дата сайнс, биоинформатике - добавляйтесь (если вам интересны соревнования или просто дата сайнс) ! А если вы биолог и ничего не знаете о ДС (и/или не хотите знать), то - все равно добавляйтесь . И вот почему:

"Пет проект(ы). Написание статьи вместе с биологами." Предлагаем организовать "пет-проект(ы)" с возможным выходом - написание статьи совместно с биологами - вокруг нового соревнования на каггл - по биоинформатики и дата сайнс - анализ мультимодальных одноклеточных данных. (Например, подобно этой статье, где весь анализ сделан на Каггл, и в которой некоторые из нас участвовали). Данные соревнования - получены по самым современным технологиям, аналогов которых - мало. Их анализ (в перспективе), может дать лучшее понимание работы клеток, улучшение в разработке лекарств и т.д. Поэтому - биологи - welcome please !

Про Kaggle (блеск и ужас). Для тех, кто не в курсе, чем Каггл прекрасен (и чем ужасен): это площадка для ДС-соревнований, которая за 12 лет привлекала к себе уже сотни тысяч дата сайнтистов. Он прекрасен, тем, что люди постоянно делятся своими решениям, своим кодом, своими данными - вы можете смотреть, что делают другие, учиться у них, задавать вопросы, обсyждать. На Kаггл действует система поощрения - люди голосуют за код и обсуждения других, и есть звания: Каггл эксперт, мастер, грандмастер. Звание Каггл мастер/грандмастера (особенно в номинации "соревнования") ценится в дата сайнс комьюнити (во всем мире) и помогает найти хорошую работу. Но есть и "темная сторона": физкультура это хорошо, а вот профи-спорт это ... Если вы слишком сильно захотите "медалей" и званий Каггл - это другое - это спорт ради спорта . Это тяжелый труд 24*7, разочарования, постепенное понимание различных ньюансов именно соревновательного дата-сайнс, который не нужен нигде кроме соревнований и так далее. Посмотрите вот этот пост - и это так у большинства.

Что предлагается делать в рамках "пет-проекта(ов)"? Идея в том, чтобы взять "светлую" сторону Каггл, и обойти стороной "темную" сторону. Предлагается посмотреть эти данные, литературу, как минимум сделать бенчмарк известных методов и тех методов, которые предложат Кагглеры, попытаться понять насколько мы видим биологический эффект, а не батч эффект этого конкретного датасета (тут нужны биологи)... А как максимум - получить Нобелевскую премию (шутка ). Также организуем вебинары, журнальные клубы, обсуждения - будем делиться опытом. Если у кого будут получаться хорошие решения - они молодцы, но стремиться к золоту любой ценой - этого делать не стоит, намного полезнее (и проще) разобраться в каких-то научных вопросах связанных с этими данными и написать статью, чем тратить уйму времени на улучшение скора на бессмысленный 0.00....0001 процент, чтобы попасть в золото. Посмотрите более подробные посты тут: Каггл1, Каггл2, Каггл3. Первые доклады уже анонсированы - см. https://t.me/sberlogabig/142 - начнем с рассказа известного многим Каггл Грандмастера Андрея Лукьяненко - что такое Каггл и с чем его едят. )

Присоединяйтесь к https://t.me/sberlogacompete будет весело !