Получи случайную криптовалюту за регистрацию!

Доброе понедельничное утро! Сегодня размышления на предмет и | WTF_HR

Доброе понедельничное утро!

Сегодня размышления на предмет искусственного простихоспади интеллекта в HR, вдохновленные субботним постом руководителя команды анализа данных Хедхантера Александра Сидорова. И в этом посте, как говорится, прекрасно все – и то, какие задачи решают с помощью машинного обучения, и то, какие результаты получают, и то, как к этому всему относится публика.

Дело в том, что искусственный интеллект, как известно, значительно легче думает, принимает решения и даже предсказывает, если у него есть четкая и понятная структура данных – и в случае профиля кандидата и вакансии такая структура должна бы основываться на нескольких параметрах с четко определенными значениями – профиль, уровень, специализация, набор подтвержденных навыков, и изменение этих параметров в ходе карьеры. И если бы то количество данных, которое есть у крупнейших джоббордов, было размечено (классифицировано) по этим параметрам), то HH, суперджоб, авито и прочие работы.ру, нег оворя уже о линкединах этого мира, уже давно бы предсказали каждому из нас жизнь и судьбу.

Но есть несколько проблем. Дело в том, что никакой такой единой классификации не существует, люди на обеих сторонах процесса найма лгут, а когда создавались джобборды, никто про машинное обучение не думал. И поэтому те гигантские объемы данных, которые находятся в распоряжении джоббордов, «размечены» так, как это было принято при развешивании вакансий на столбах – то есть никак, это просто текстовое описание.

И поэтому вместо классификации по ограниченному количеству признаков (сравнительно несложная для математиков задачка), аналитики данных в джоббордах занимаются обработкой естественного языка – а это значительно сложнее, дольше и результат получается ну такой. Потому что приходится учить машину понимать логику человеческой речи: например, что «без опыта холодных продаж» – примерно то же самое, что «готов научиться/готовы научить холодным продажам», но не то же самое, что «не готов/не нужно делать холодные продажи» и «являюсь/нужно быть готовым специалистом по холодным продажам».

Таких нюансов в русском языке – тысячи, а знание каждого из них улучшает результат поиска на настолько незаметную долю, что даже запуск большой хорошо обученной модели, умеющей распознавать кучу таких шгтук, привел к тому, что через HH ежедневно начали нанимать всего на 200 человек больше, чем до того. Двести кажется большим числом, если не знать, что общее количество ежедневно нанимаемых через HH по оценкам находится в районе 40 000. То есть команда высокооплачиваемых ML-экспертов годами работает, чтобы улучшить количество ежедневно нанимаемых кандидатов… на полпроцента. Если вы нанимаете по тысяче человек в год, то наймете еще пять. Вряд ли кто-то из пользователей это вообще заметил, не то что очередное повышение цен.

Но есть и еще одна история. Сначала, когда джобборды рекомендовали кандидатов, основываясь просто на совпадении текста вакансии и резюме, результат был настолько не впечатляющий, что интернет кишел возмущенными отзывами. Сейчас, если верить Александру, процент приглашенных на интервью кандидатов из рекомендаций превышает долю тех, кого эйчары нашли сами с помощью поиска. Но даже при этом треть запросов в поддержку HH можно перевести на простой русский язык как «что за чушь вы мне опять порекомендовали».

Довольно часто по результатам проверки выясняется, что машина таки нашла более релевантные резюме, чем рекрутер (это не так сложно и страшно – машина просто по определению более внимательна, чем человек). Но сказать человеку «робот сделал лучше вас» нельзя, никто не хочет почувствовать себя героем «Черного Зеркала».
Так специалисты по машинному обучению в HR и живут: сделал плохо – получи «развивающую обратную связь». Сделал хорошо – все равно вот тебе, дружище. Но с другой стороны, а кому сейчас легко?

Хорошей недели!