2022-06-02 14:23:24
Как работают алгоритмы hh
На этой неделе мы включили на всех версию поиска по резюме, которая учитывает смысл последовательностей слов в запросах и резюме с помощью нейросетей RNN DSSM (это такое кодовое название, там давно уже гораздо больше частей). Благодаря этому, работодатели стали нанимать на 590 кандидатов в день больше.
Хочу порекламировать запросы из нескольких слов. После того, как мы сделали, чтобы поиск по резюме стал персонализированным и не больше чем через 5 минут учитывал, что общего у резюме, по которым работодатель приглашал или смотрел контакты, мы увидели, что количество пустых запросов выросло с примерно 20% до 31%. Конечно, это не как в поиске по вакансиям, в котором пустых запросов уже больше 70%, но всё равно много. Показывать хорошую выдачу при пустом запросе соискателям проще, у них, кроме поведения, почти всегда есть главное резюме. А работодателям сложнее, они почти всегда нанимают на несколько вакансий сразу и часть из них вообще не опубликована, но тоже можно.
Казалось бы, нажал "найти" без запроса - и поиск вывел интересных кандидатов, особенно если до этого в течение недели кого-то приглашал, вот этого можно в менеджеры по продажам, вот этого по закупкам, этот подойдёт в маркетинг, а вот в IT-проекты. Но вам при этом приходится переключать контекст и терять на этом время. Вот засеките на часах, сколько займёт, если сначала явно введёте, например, "менеджер по продажам торгового оборудования", пригласите пятерых подряд, а потом, например, "трафик менеджер", и снова пригласите пятерых. И сравните, сколько занимает с пустым запросом или запросом "менеджер" нанимать, не концентрируясь, вразнобой.
Дело конечно, не в том, что RNN DSSM станет менее полезной, если запросы станут пустыми. Или что у нас может стать меньше примеров для обучения моделей. Пользуйтесь так, как удобнее и эффективнее. Просто, по нашим измерениям, при поиске с запросом у работодателей получается нанимать примерно на 21% эффективнее, чем без.
Кстати об обучающем множестве. Ранжирование с помощью ML в поиске по резюме работает, только если выбран поиск по соответствию, только пока в запросе не используется язык поисковых запросов (подробнее в https://hh.ru/article/23786 ) и настроено всего одно условие (да-да, в расширенном поиске можно сделать больше, подробнее в https://hh.ru/article/25295 ). Когда это не так – мы предполагаем, что работодатель знает, что делает, и ему надо не помогать, а не мешать.
Но при этом раньше модели учились на всех запросах. А теперь мы сделали, чтобы они учились только на тех примерах, на которых применяются и не тратили свою способность к обобщению (которая всегда ограничена) на выучивание всех закономерностей подряд, тем более в сложных запросах, и сконцентрировались на сравнительно простых. В результате, работодатели стали нанимать на 430 кандидатов в день больше.
Резюме – не то, что можно скачать на будущее. Если так делать – контакты быстро заканчиваются, но уже через неделю около половины тех, кто искал работу, её находят, и резюме становятся холодными, а через 2 года больше половины кандидатов уже работают в другом месте, часто на другой позиции, и старые версии резюме когда-то становятся не только холодными, но и нерелевантными. Звонок или письмо по такому резюме, с попыткой обсуждать найм на профессию, которая у соискателя была когда-то давно и которую он, нередко, уже перерос – в большинстве случаев трата времени работодатели впустую, а для соискателя – просто спам, с запоминанием работодателя, как спамера. Особенно странно выглядят попытки работать с возражениями кандидиата, убеждать дауншифтиться, но не ради комфорта, а чтобы непонятно что.
Но многие до сих пор так делают. Поэтому мы в целевых функциях моделей в поиске по резюме стали учитывать, что приглашение, которое работодатель отправляет соискателю здесь и сейчас, важнее, чем просмотр контакта резюме, который может быть как на сейчас, так и на будущее. В результате ещё около 140 наймов в день.
Пользуйтесь поиском по резюме на здоровье!
#полезное
473 views11:23