2021-06-20 10:02:44
Дайджест новостенй из мира данных, статистики и ML
1. FB выложил набор данных FLORES-101. Это языковой датасэт из 100 различных языков плюс Английских. Поддерживается 10100 направлений. То есть, например, можно учить с Азербайджанского на Чешский. Авторы подчёркивают, что в основе лежит не только новостной контент, но и другие области знаний
2. Accentor – ещё один датасет от FB. Здесь вы найдете чаты пользователей с разметкой от человека
3. Если вы устали от Atari, то вот новый подход к соревнованиям в RL от FB
4. Классный текст с картинками на тему проблемы «сглаживания» в Graph NN
5. Спектральный анализ композиций из Spotify с примерами кода
6. Заметка на тему вечного холивара: байесовской и классической статистики
7. Гайд по построению pipeline на ванильном scikit-learn
8. Отчет о состоянии проблем математической оптимизации (по большей части маркетинговый)
9. Проекты и наборы данных для начинающих дата аналитиков
10. Набор данных человеческих нейронных связей H01 от google
11. Модель FRILL позволяет обрабатывать голос на мобильных устройствах
12. Точные физические симуляции с помощью RL
13. Анонс курса ML для инженеров
14. Руководство по квантовым вычислениям на TF
15. MIT сделал квантовые вычисления более пригодными для жизни
16. Распознавание объектов с TF-lite
17. Мощное руководство по предсказанию цен акций с глубоким обучением
18. Анализ статьи google brain на тему функций активации
19. Анализ статьи «Внимание как активация»
20. Руководство по верификации лиц на keras
21. Релиз Rqlite 6.0 - интересной технологии распределённой СУБД на базе sqlite
22. Outrun – простой запуск распределённых задач на других linux машинах
245 viewsAndrey, edited 07:02