«Что наша жизнь?»
Имитация активности :-(
Пару лет назад я позволил себе погрузится в сумрачную футурологию и порассуждать об интеллекте с позиции контекстного знания.
«В играх побеждает ИИ. Непокоренных вершин все меньше: шахматы давно не проблема, Го сдалась издевательски легко, Starcraft взят, CS:GO – остался уделом китайских заключенных. Примеры множатся чуть ли не каждую неделю.
Вопрос с остальными формулируется не как, а когда.
Традиционный киберспорт потихоньку становится Паралимпиадой.
Если ИИ участвует в очередной стратегии, дальше он начинает в нее выигрывать.
Вопрос решен.»
Дальше следовал небольшой пересказ того, как наблюдая за границами восприятия человека можно сделать вывод о содержательной стороне его дальнейших действий.
Здесь помимо бытового пессимизма и антиутопии обычно включается позиция «машина никогда не почувствует человека».
Она всегда казалась мне достаточно зыбкой. За отсутствием предметного обсуждения околонаучное знание оборонялось щитом из набора непокоренных высот.
В игровом поле такой высотой долгие годы оставался покер.
Действительно, помимо вероятностей и несложного подсчета там существовала теневая область блефа, подставляемой в качестве человеческого фактора, принципиально не осваиваемого машиной.
Позавчера Science опубликовала работу, вносящих корректировку в привычный ход оправданий.
Бот Pluribus не только наказал десяток топовых покеристов, но и, по утверждению авторов, научился играть вообще без рук оппонентов, прогнозируя их ходы с учетом того самого блефа.
Эмоция и обман – могут быть интерпретированы в качестве вероятностной величины на основе примерно 120 миллиардов игр в памяти.
Похожий результат был у предыдущей версии, Libratus. В 2017-м кому-то все же удалось взять верх над ботом.
Теперь уже просчетов не случилось.
Понятно, что речь идет о 10000 раздачах и проектном обучении. Однако из области качественных различий покер спустился в категорию шахмат. Болезненное падение, да.
Впрочем, дело же не в игре, как таковой. Проблему можно сформулировать шире. В упрощенном виде мы видим задачу «византийских генералов». Решения базируются не только на видимых игрокам картах, но и на их намерениях относительно суммы выигрыша. Вторая переменная гораздо комплекснее, но дедукция от нее позволяет построить дерево вариантов с учетом лжи (т.е. отсутствующих фактов).
Потенциально в таком виде можно представить любую политическую ситуацию.
Вопрос только в глубине ее проработки и поправке на иррациональность.
Последнее обстоятельство уже включено в периметр задачи о покере.
https://telegram.me/mikaprok
li_bao
July 12 2019, 17:15:38 UTC 1 week ago