Адрес канала:
Категории:
Технологии ,
Образование
Язык: Русский
Страна: Россия
Количество подписчиков:
8.30K
Описание канала:
Новости и обзоры статей на тему обработки естественного языка, нейросетей и всего такого.
Связь и реклама: @dropout05
Рейтинги и Отзывы
Оценить канал dlinnlp и оставить отзыв — могут только зарегестрированные пользователи. Все отзывы проходят модерацию.
5 звезд
1
4 звезд
2
3 звезд
0
2 звезд
0
1 звезд
0
Последние сообщения 24
2021-03-30 15:13:50
1.9K viewsVlad Lialin, 12:13
2021-03-30 15:09:34
Few-Shot Text Classification with Triplet NetworksWei et al.
arxiv.org/abs/2103.07552
Очень простой подход к few-shot. Тренируем ранжирующую сетку с triplet loss на основе BERT. Добавляем к этому всему аугментации данных (случайные добавления/выбрасывания/... слов). Называем умным словом curriculum learning то, что мы в начале учимся на настоящих данных, а потом на аугментированных (разве не наоборот обычно делают на кагле?). Увеличиваем силу аугментаций в течение тренировки. Добавляем к этому hard negative mining.
В результате эти хаки помогают заметно улучшить бейзлайн, в особенности hard negatives и усиление аугментаций.
Весьма практичная статья, думаю может быть интересно попробовать на настоящих задачах.
код: github.com/jasonwei20/triplet-loss
ещё один обзор: andlukyane.com/blog/paper-review-nlptriplettricks
2.0K viewsnlpcontroller_bot, 12:09