2021-05-06 20:57:27
ИИ от Цукерберга готовят на смену Госсекретарю США.
Новый шаг ИИ к превосходству над людьми.Потенциал способностей ИИ позволит ему:
• либо превзойти людей только в отдельных областях,
• либо превзойти во всем, и тогда привет.
Прояснение этого вопроса происходит этапами. И только что начался 3й - решающий этап.
Дело было так.
Этап 1.
Сначала ИИ превзошел людей в
состязательных играх (где стороны интеллектуально противостоят друг другу).
Первым пал бастион
игр с открытой информацией, в которых игроки обладают полным знанием всех прошлых событий и нынешней ситуации в игре: шахматы, Го – всюду ИИ от DeepMind сумел выйти на недостижимый людям уровень игры.
Этап 2.
Взят бастион
игр с неполной информацией. В таких играх игроки знают не все: напр., в покере, - какие карты у других игроков (этот класс игр особенно интересен для экономистов, т.к. включает практические проблемы — поиск оптимальных стратегий для заключения сделок и аукционов). В 2017 ИИ Libratus победил в 20-дневном покерном турнире и выиграл у профессиональных игроков более 1,7 миллиона долларов.
Отличительной особенностью ИИ Libratus стало его свойство
минимизировать «сожаление» о собственных плохих решениях. Специальный алгоритм для каждого решения вычисляет значение «сожаления» — насколько алгоритм «сожалеет» о том, что он не сделал определенный шаг в прошлом. Сначала алгоритм принимает решения случайно, но затем подключает к каждому решению значение «сожаления», в зависимости от того, насколько плохим оно было. К этому умению ИИ «сожалеть» добавили 262 терабайта информации для выработки стратегии, сумев ужать её до 11 терабайт, и привет: профессионалам пришлось слиться и в игре с неполной информацией.
Этап 3 (2021).
Потерпев полный крах в состязательных (конкурентных) играх, за людьми оставалось преимущество:
- в
играх кооперативных (где нужно кооперироваться с другими игроками)
- и в самом сложном -
смешанных конкурентно-кооперативных играх.
Казалось, что здесь ИИ ловить нечего. Но увы, пал и этот, почти что последний бастион.
5 мая на ICLR-2021 (одна из 3х самых крутых ИИ конференций) троица из Facebook AI Research рассказала о новом ИИ, уже играющем на уровне ТОР 2% лучших мировых игроков в конкурентно-кооперативную игру «Дипломатия».Это стратегическая
игра в меняющиеся альянсы, которая включает в себя как сотрудничество, так и конкуренцию в Европе, разделенной на 75 провинций. В игру играют семеро игроков, которым, помимо умения конкурировать и сотрудничать, требуется хитрость, обман и коварство, (как и в реальной дипломатии). А еще (т.к. на каждом ходу игроки делают ходы одновременно) нужно моделировать, что другие думают о вас и вашей стратегии. Игроки строят и мобилизуют воинские части для оккупации провинций, пока кто-либо не захватит большинство центров снабжения. Игроки могут атаковать или защищаться, могут, создавая союзы, поддерживать атаки и защиту других игроков. В полной версии игроки могут вести переговоры. В упрощенном варианте игры «дипломатия без прессы», переговоров нет.
Перебор вариантов здесь невозможен. В самой короткой 20-ходовой игре можно сыграть почти 10^868 способами (это 10 с 868 нулями). Поэтому Facebook применил убойный сдвоенный алгоритм, сочетающий
контролируемое обучение на человеческих данных с одноэтапным поиском с помощью
минимизации «сожалений». Алгоритм реализован в боте SearchBot, который превзошел бот DeepMind’a, анонимно играя против людей на веб-сайте Diplomacy и войдя в 2% лучших игроков. Но это лишь начало.
Ждать абсолютного превосходства ИИ над людьми в игре Дипломатия не долго. В планах Facebook: задействовать обучение с подкреплением, минимизировать «сожаление» более чем на 1 ход, расширить союзы умением координировать действия. Подробней.
Если всё получится, взращенный Цукербергом ИИ сможет со временем сильно упростить работу Госсекретаря США.
#ИИ
4.6K views17:57