Получи случайную криптовалюту за регистрацию!

Spark in me

Логотип телеграм канала @snakers4 — Spark in me S
Логотип телеграм канала @snakers4 — Spark in me
Адрес канала: @snakers4
Категории: Технологии
Язык: Русский
Количество подписчиков: 2.68K
Описание канала:

Lost like tears in rain. DS, ML, a bit of philosophy and math. No bs or ads.

Рейтинги и Отзывы

2.50

2 отзыва

Оценить канал snakers4 и оставить отзыв — могут только зарегестрированные пользователи. Все отзывы проходят модерацию.

5 звезд

0

4 звезд

0

3 звезд

1

2 звезд

1

1 звезд

0


Последние сообщения 5

2022-06-06 21:27:05 Audio Samples

English
- https://soundcloud.com/alexander-veysov/sets/silero-tts-v3-english

Indic English - https://soundcloud.com/alexander-veysov/sets/silero-tts-v3-indic-english

Spanish - https://soundcloud.com/alexander-veysov/sets/silero-tts-v3-spanish

Kalmyk - https://soundcloud.com/alexander-veysov/sets/silero-tts-v3-kalmyk

German - https://soundcloud.com/alexander-veysov/sets/silero-tts-v3-german

Russian - https://soundcloud.com/alexander-veysov/sets/silero-tts-v3-russian

Tatar - https://soundcloud.com/alexander-veysov/silero-tts-v3-tatar

Uzbek - https://soundcloud.com/alexander-veysov/silero-tts-v3-uzbek

Ukrainian - https://soundcloud.com/alexander-veysov/sets/silero-tts-v3-ukrainian

French - https://soundcloud.com/alexander-veysov/sets/silero-tts-v3-french

Indic languages - https://soundcloud.com/alexander-veysov/sets/silero-tts-v3-indic
559 viewsAlexander, 18:27
Открыть/Комментировать
2022-06-06 21:25:00 Silero TTS Full V3 Release

Improvements:

- Huge release - 20 languages, 173 voices;
- 1 new high quality Russian voice (eugene);
- The CIS languages: Kalmyk, Russian, Tatar, Uzbek и Ukrainian;
- Romance and Germanic languages: English, Indic English, Spanish, German, French;
- 10 Indic languages;
- Russian automated stress model vastly improved (please see the article for more details);
- All models inherit all of the previous SSML perks;

Links:

- Project page - https://github.com/snakers4/silero-models#text-to-speech
- SSML wiki - https://github.com/snakers4/silero-models/wiki/SSML
- Detailed Russian post https://habr.com/ru/post/669910/

Please like, share, repost
520 viewsAlexander, 18:25
Открыть/Комментировать
2022-06-06 12:26:34 Год назад я выложил пост про rubert-tiny, миниатюрный энкодер предложений для русского языка.
В комменты пришёл @snakers4 и справедливо придрался, что я не сравнил свою модель с очевидными бейзлайнами: FastText, USE, Laser.

Спустя полгода я прокачал модель до rubert-tiny2 и сравнил ещё с кучей бейзлайнов.
А сейчас у меня наконец дошли руки накатать про это пост: Рейтинг русскоязычных энкодеров предложений.

TL;DR: если в вашем sentence encoder'е важно только качество на разнообразных задачах, юзайте USE, если очень важна скорость – FastText. Моя rubert-tiny2 – между ними; остальные модели проигрывают по качеству или скорости этим трём.
535 viewsAlexander, 09:26
Открыть/Комментировать
2022-06-06 12:05:08 Рейтинг русскоязычных энкодеров предложений

Полезные в реальной жизни энкодеры предложений на русском - птица редкая.

Поэтому я просто без лишних слов возьму и репостну эту статью:

- https://habr.com/ru/post/669674/

Мой развернутый комментарий - https://habr.com/ru/post/669674/#comment_24412620

Максимальный репост.

#deep_learing
628 viewsAlexander, edited  09:05
Открыть/Комментировать
2022-06-01 13:35:12
Continue sharing digests?
Anonymous Poll
68%
Yes
27%
Yes, but not enough time to read
5%
No / what are digests
137 voters546 viewsAlexander, 10:35
Открыть/Комментировать
2022-06-01 13:26:29 Digest 2022-05

Code

Massive
memory overhead: Numbers in Python and how NumPy helps - https://pythonspeed.com/articles/python-integers-memory/

Как изменилась стандартная библиотека Python за последние годы - https://habr.com/ru/post/665020/

Faster, more memory-efficient Python JSON parsing with msgspec - https://pythonspeed.com/articles/faster-python-json-parsing/


CPUs, cloud VMs, and noisy neighbors: the limits of parallelism - https://pythonspeed.com/articles/cpu-limits-to-speed/

Why I no longer recommend Julia - https://yuri.is/not-julia/

Мой опыт с резиновым мужиком. Github Copilot - https://habr.com/ru/post/666538/

A tableau of crimes and misfortunes: the ever-useful docker history - https://pythonspeed.com/articles/docker-history/

"What if it changes?" - https://chriskiehl.com/article/the-tyranny-of-what-if-it-changes

Асинхронный python без головной боли - https://habr.com/ru/post/667630/

Протоколы в Python: утиная типизация по-новому - https://habr.com/ru/post/557898/

#digest
527 viewsAlexander, 10:26
Открыть/Комментировать
2022-06-01 13:25:17 Digest 2022-05

Datasets

StyleGAN-Human: A Data-Centric Odyssey of Human Generation - https://stylegan-human.github.io/ (data to be released)

What is WebFace260M https://www.face-benchmark.org/index.html

- Noisy 4M identities and 260M faces
- High-quality training data with 42M images of 2M identities by using automatic cleaning
- A test set with rich attributes and a time-constrained evaluation protocol

#digest
466 viewsAlexander, 10:25
Открыть/Комментировать
2022-06-01 13:22:40 Digest 2022-05

Hardware

Умельцы впервые полностью обошли алгоритм ограничения майнинга в GeForce RTX 3000 - https://habr.com/ru/news/t/664904/

WDC: To Split, or Not to Split? - https://thessdguy.com/wdc-to-split-or-not-to-split/

SEMIS READ THROUGH FROM AMAZON’S EARNINGS - https://digitstodollars.com/2022/05/05/semis-read-through-from-amazons-earnings/

WE ARE THINKING ABOUT AR/VR WRONG - https://digitstodollars.com/2022/05/24/we-are-thinking-about-ar-vr-wrong/

NVIDIA А5500: реальная мощь или фейслифтинг? - https://habr.com/ru/company/hostkey/blog/667886/

Newer Russian CPUs review -



#digest
457 viewsAlexander, edited  10:22
Открыть/Комментировать
2022-06-01 13:21:37 Digest 2022-05

ML

Deep Learning in Neuroimaging - https://thegradient.pub/the-role-of-deep-learning-in-understanding-neuroimaging-data/

Alpa: Automated Model-Parallel Deep Learning - https://ai.googleblog.com/2022/05/alpa-automated-model-parallel-deep.html

Rethinking Human-in-the-Loop for Artificial Augmented Intelligence - https://bair.berkeley.edu/blog/2022/05/03/human-in-the-loop/

How Should you Protect your Machine Learning Models and IP? - https://petewarden.com/2022/05/08/how-should-you-protect-your-machine-learning-models-and-ip/

Hiding a photo inside another photo - https://www.avestura.dev/blog/hide-a-photo-inside-another-photo

Unlocking Zero-Resource Machine Translation to Support New

Languages in Google Translate - https://ai.googleblog.com/2022/05/24-new-languages-google-translate.html

Baidu and Pony.ai become first robotaxi services to operate without safety drivers in Beijing - https://www.theverge.com/2022/4/30/23050493/baidu-pony-ai-first-robotaxi-services-operate-without-safety-drivers-beijing-china

Tackling multiple tasks with a single visual language model - https://www.deepmind.com/blog/tackling-multiple-tasks-with-a-single-visual-language-model

Lessons From Deploying Deep Learning To Production (it's all about feedback loops) - https://thegradient.pub/lessons-from-deploying-deep-learning-to-production/

OPT: Open Pre-trained Transformer Language Models - http://arxiv.org/abs/2205.01068
- Talk about gatekeeping: access will be granted to academic researchers; those affiliated with organizations in government, civil society, and academia; and those in industry re- search laboratories
- OPT-175B on 992 80GB A100 GPUs (1/7th the carbon footprint of GPT-3)

WHO WILL END UP HOLDING THE SEMIS BAG? - https://digitstodollars.com/2022/05/18/who-will-end-up-holding-the-semis-bag/

Image-Text Pre-training with Contrastive Captioners - https://ai.googleblog.com/2022/05/image-text-pre-training-with.html

The Future of Interactive Media — Pipelining StyleGAN3 for Production - https://medium.com/codex/the-future-of-interactive-media-pipelining-stylegan3-for-production-636c080db2f4

(De)ToxiGen: Leveraging large language models to build more robust hate speech detection tools - https://www.microsoft.com/en-us/research/blog/detoxigen-leveraging-large-language-models-to-build-more-robust-hate-speech-detection-tools/

Partnering people with large language models to find and fix bugs in NLP systems - https://www.microsoft.com/en-us/research/blog/partnering-people-with-large-language-models-to-find-and-fix-bugs-in-nlp-systems/

StarGANv2-VC: A Diverse, Unsupervised, Non-parallel Framework for Natural-Sounding Voice Conversion - https://starganv2-vc.github.io/

#digest
391 viewsAlexander, edited  10:21
Открыть/Комментировать
2022-05-27 17:27:53 https://m.roem.ru/27-05-2022/291315/ashmanov-korotko-tysyach/

Понятно зачем Ашманов эту страшилку рассказывает (угадаете зачем?), но непонятно зачем Роем ее перепечатывает.

Но в целом думаю, что про уровень социальной ответственности на рынке детекции лиц там все верно написано.
516 viewsAlexander, 14:27
Открыть/Комментировать