Максим Солохин (palaman) wrote,
Максим Солохин
palaman

Го и Пустота

Статья об игре Го (Драма, которая изменила мою реальность) была благосклонно воспринято читателем, и у меня возникло желание опубликовать несколько текстов, написанных мною пару лет назад и не опубликованных потому, что я сомневался, будет ли это кому-то интересно.

Го и Гугль

Сообщение 2015 года о том, что Гуглевский бот выиграл чемпиона мира по игре Го потрясло меня. До этого момента я был, как и все прочие человеки, абсолютно уверен в том, что пройдет ещё немало времени, прежде чем вычислительные способности компьютеров приблизятся к уровню человеческой интуиции. Потому что число вариантов игры Го примерно равно числу вариантов игры Шахматы, возведенному в квадрат! Сказать, что оно безумно велико – значит ничего не сказать. Грубо говоря, это десять в трехсотой степени. Гуголь в кубе!!!


[Spoiler (click to open)]
Вычислять наилучший ход, тупо перебирая варианты – дело в Го почти безнадежное. Го интересно именно тем, что здесь гораздо более эффективным является подход эстетический, чем математический. Мастер ставит камни на доску красиво – прежде всего именно красиво! и гармония побеждает тупой математический расчет. Это была одна из главных причин, почему Го привлекло меня в молодости. Другая причина – привкус дальневосточной мистики, который не отделить от этой игры. Игра Го – наглядный пример вечной борьбы и взаимного порождения Инь и Ян. Тем более интересный пример, что его можно изучать и оценивать математически. Возможность измерить алгеброй гармонию Инь и Ян – слишком ценная добыча, чтобы я мог просто пройти мимо.

Надо сразу сказать, что Гугль пошел другим путем. Основа действия его программы – опять-таки не расчет, а подражание человеку. Рассматривая позицию на доске, Гугль сравнивала её с имеющимися в базе данных партиями, и ходила по аналогии, подражая игре мастеров. Это основа! А далее, программа уже несколько лет непрестанно играет сама с собой, накапливая новый и новый опыт. И вот, оказывается, что ТАКОЙ интеллектуальной мощи человек противостоять неспособен. В тот день, когда я осознал это, мой мир изменился. Я поверил в роботов и приготовился к тому, что спустя некоторое время они овладеют всеми человеческими профессиями. Надежды больше нет. Я увидел чемпиона мира по Го побежденным железякой, и осознал, что дивный новый мир уже наступил. Скоро общественный транспорт исчезнет, и все мы будем ездить на беспилотных такси, логистика которых будет определяться каким-нибудь Яндексом. Вышел на перекресток, послал запрос – и через пять минут подойдет микроавтобус, в котором сидят случайные попутчики. Или персональная легковушка, если ты объявил, что готов заплатить больше. Впрочем, скорее всего, Яндекс будет знать тебя как облупленного, все твои привычки. И предвидеть все твои обычные запросы заранее. А может, и необычные – по крайней мере, если за это возьмутся так же основательно, как взялись за Го.

Узнав о победе компьютера над человеком в игре Го, я начал пересматривать свои представления о мире. Но вместе с тем, я снова начал размышлять о Го, тем более что сейчас есть бесплатные программы, которые играют на очень неплохом уровне, вполне достаточном, чтобы игрок-любитель вроде меня не расслаблялся, но вынужден был пускать в ход всю свою интуицию и эстетическое чутье.

А вслед за тем у меня появилось и желание рассказать моему читателю о своих размышлениях по поводу самой игры, безотносительно к вопросу о дивном новом мире. В отличие от шахмат, Го входит в этот новый мир с честью. Пусть программа и победила человека – но создатели этой программы не могу объяснить, как она это сделала. Го было и остается, и скорее всего остается тайной для нас даже после того, как искусственный интеллект постигнет эту тайну. Эта восточная игра продолжает будоражить моё воображение - и оттого, что теперь она прочно связалась в моем уме с вопросом об искусственном интеллекте, её древняя мистика всего лишь становится мистикой современной.
В самом деле, как бы успешно ни развивалась вычислительная техника, едва ли когда-нибудь ядро процессора будет совершать более одной операции за Планковское время. Это естественное ограничение, накладываемое квантовой природой материи. Значит, ядро процессора не может иметь быстродействие более (10**33) операций в секунду. С другой стороны, число таких ядер не может превышать количества элементарных частиц по Вселенной (10**80), а общее время расчета едва ли имеет смысл брать большим, чем время жизни Вселенной (10*17) секунд. Итого, какими бы фантастическими ни были успехи человечества в области Искусственного Интеллекта, мы никогда не сможем перебрать более (10**150) вариантов игры Го. Этого явно недостаточно, чтобы исследовать Го полностью и наконец закрыть эту тему. Следовательно, Го ещё будет преподносить человечеству новые и новые сюрпризы.



Го и Пустота

Мне было бы гораздо удобнее говорить с читателем, который знаком с Го, и я бы предложил читателю, у которого будет свободное время, посмотреть несколько первых серий аниме «Хикару но го». Этот сериал японцы сняли специально для рекламы Го среди своей японской молодежи. Рассказ начинается с того, как обычному школьнику является некий дух, который выдает себя за душу мастера, которая нигде не находит покоя после смерти, кроме как на гобане. Этот дух желает играть и использует мальчика, чтобы играть с современными мастерами. Ну, а для ребенка весьма лестно выходить победителем, делая гениальные ходы по подсказке «свыше». Потом мальчик сам увлекается игрой, и сериал становится скучным, так как история духа отходит на второй план, уступая место зануднейшей бытовухе какого-то провинциального Го-клуба. Но к концу действие опять оживает: дух исчезает, оставляя позврослевшего мальчика тосковать по себе. Только теперь Хикару понимает, как ему повезло и каким он был дурачком. Но все кончается хорошо: оказывается, дух не ушел, а вселился в душу Хикару, и Хикару теперь "сам" проявляет гениальные способности к игре. Короче, начало и конец сериала очень даже неплохие по мой вкус.

Но поскольку подавляющее большинство моих читателей едва ли знают о Го что-то кроме самого названия, мне придется все-таки изложить основы, и по возможности так, чтобы это было не скучно. Мою задачу облегчает то обстоятельство, что игра Го является безусловным и беспрецедентным чемпионом по отношению «сложность игры поделить на сложность её правил». Правил в Го так мало, и они настолько естественны, что порой об их существовании вообще забываешь, будто их и нет.
А что есть? Есть расчерченная доска (гобан) и есть камни двух цветов (Инь и Ян), которые противники по очереди выставляют на доску. Вначале доска пуста. Ставить камень можно на любой свободный пункт. (А если не хочешь, можешь не ставить никуда и просто пропустить ход!) На любой! Этим и обусловлено кошмарное число вариантов игры. Камень не сдвигается с места до конца игры, если только противник его не срубит. Этим объясняется эффективность человеческой интуиции в Го. Вся позиция в текущий момент и все возможные варианты её дальнейшего развития – вот они, перед глазами. Текущая ситуация видна, а будущая вообразима. В шахматах ситуация на доске постоянно меняется, шахматы трехмерны (время – это третье измерение) и потому плохо помещаются в нашем сознании; компьютер с его огромной памятью и быстродействием сразу получает превосходство перед человеком.
Го двумерно. Всё видно, всё открыто, всё предельно обнажено, ничто не препятствует свободной работе воображения – главному преимуществу человеческого ума. Игра развивается поступательно и необратимо. Вначале доска пуста, потом камней становится больше и больше, пока они не заполняют доску в такой мере, что уже можно сказать, кто из противников одержал победу. Труднее всего для человека просчитывать как раз такие варианты игры, когда часть камней снимается с доски и заменяется новыми, особенно если камень заменяется камнем другого цвета снова и снова несколько раз («ко-борьба»). В таких случаях компьютер почти сразу обнаруживает свое превосходство над нами – человеку трудно воображать такие динамичные системы как целое. Мы легко охватываем взором двумерные картины, но плохо вмещаем в своем уме трехмерие. Но, по счастью, в Го такое случается не очень часто и потому не сильно влияет на человеческое качество игры в целом. А Шахматы - они целиком основаны на перемещениях. Вот причина, почему люди так быстро уступили компьютеру в шахматах, но при этом так долго продержались в Го.

Итак, пустая доска постепенно заполняется камнями, камень за камнем, поочередно черный и белый.
Черные (Инь) ставят камень первыми, они начинают игру, символизируя зло, нарушение первоначальной идеальной гармонии (пустота на доске – это и есть идеальная гармония). Белые (Ян) вынуждены отвечать, восстанавливая утраченную гармонию. Конечная цель борьбы – занять территорию. Инь и Ян делят между собой гобан, кому сколько достанется. Пустая территория, окруженная твоими камнями, считается твоей территорией. Но если она окажется слишком большой, белые смогут набросать туда своих камней и построить там живую фигуру. Потому большая территория обязательно должна быть разделена на достаточно маленькие укрепленные участки, куда вторгаться бесполезно. Обычно к концу игры примерно половина пунктов гобана остается незанятой и отходит во владение черных либо белых. Можно сказать, что цель игры – оградить достаточно прочным «забором» как можно больше пустого места. Пустота, незанятая земля – это та ценность, ради которой ведется война. Потому не стоит без особого умысла ставить камни слишком плотно, слишком близко друг ко другу – это нерациональное расходование ресурса.

Край доски – это естественная граница территории, потому углы захватить легче всего, и вначале противники как правило бросают туда, чтобы застолбить территорию. А уже потом начинается борьба за стены и, наконец, за центр доски.

Пустота – это жизнь. По правилам Го, любая фигура живет до тех пор, пока она соприкасается с пустотой. Фигура – это несколько камней, соединенных между собой. Если два камня касаются друг друга, то они принадлежат одной и той же фигуре. Когда мы добавляем камень к фигуре, фигура растет. Если фигура не может больше расти, то она немедленно умирает и снимается с доски. Нет пустоты – нет жизни. Мертвая фигура освобождает место для живительной пустоты. Чем больше пустых пунктов, с которым соприкасается фигура, тем больше в ней жизни. Камни одной фигуры живут общей жизнью до конца игры, или же снимаются с доски одновременно – сразу, как только оказалось, что ни один из них больше не соприкасается с пустотой.

Итак, противники борются между собой за обладание пустотой, пустота же и обеспечивает им жизнь. Этим определяется цель игры, её динамика и её своеобразная эстетика, которую довольно скоро начинаешь ощущать. Заполняя доску, противники постепенно лишают друг друга пустоты, и надо успеть застолбить себе надежную территорию, которая будет гарантировать твоим фигурам жизнь в дальнейшем, когда на доске станет тесно. Кто не успел – тот опоздал. Окруженная и «задушенная» камнями противника фигура снимается с доски и снова превращается в пустоту. Пустоту, окруженную противником и принадлежащую ему, так как она соприкасается лишь с его камнями.

Пустая территория, которая соприкасается и с камнями противника, и с твоими камнями, считается нейтральной и спорной. Согласно древним китайским правилам, игра велась до тех пор, пока оставался хотя бы один нейтральный пункт. Все неудачно выставленные камни противника следовало «задушить» и снять с доски. После этого нейтральных полей не оставалось, и вся доска оказывалась однозначно поделена между соперниками. Далее производился подсчет площади, занятой твоими камнями и плюс принадлежащей тебе территории. Это и есть набранные тобой очки. Если ты набрал больше очков, чем противник, то ты победил. Вот и всё.

Постепенно было осознано, что не обязательно доводить игру до конца, чтобы понять её результат. Японцы научились играть в Го от китайцев, и сразу приняли другие правила подсчета очков, более простые и удобные, но менее строгие в математическом смысле. Игра теперь ведется до тех пор, пока оба противника пропустят ход. После этого они обсуждают ситуацию и соглашаются между собой, что такие-то фигуры являются нежизнеспособными, пленными. Если возникает разногласие, то игра возобновляется и спорная фигура либо снимается с доски, либо доказывает свою жизнеспособность. Если разногласий нет, пленные просто снимаются с доски и добавляются к числу срубленных фишек. Оставшуюся нейтральной территорию просто игнорируют. После этого японцы выставляют обратно на доску все пленные и срубленные камни, заполняя ими территорию своего противника. Чем больше камней ты потерял, тем меньше останется у тебя территории. После этого считают свою территорию - именно пустоту и только пустоту. Так играть и так считать намного быстрее и удобнее.
Профессионалы идут ещё дальше и вообще как правило не доводят игру до конца – кто-то из них признает свое поражение, хотя на взгляд непрофессионала в этой позиции ещё ничего не понятно, надо бы играть и играть. Вот например, здесь черные сдались:

(Го Сэйгэн против Китани Минору, Токио, 1957 г.)

Есть ли разница между китайским и японским Го? Поскольку противники ходят по очереди, количество черных фишек на доске после того как японцы выставили назад всех пленных и убитых равно количеству белых фишек. И потому нет разницы, считать ли только пустоту, как это делают японцы – или считать также и фишки, как это делают китайцы. Разница между двумя способами подсчета может составлять одно очко: в том случае, если черные сделали ход последними, они выставили на доску на один камень больше, чем белые. Японская система подсчета в этом случае оказывается чуть-чуть выгоднее с точки зрения белых, а китайская – с точки зрения черных. Если последний ход был белых, то разницы нет вообще.

Различие между японскими и китайскими правилами состоит также в том, что японцу выгодно пропускать ходы, а китайцу это безразлично. Пропускать ходы можно, но это просто невыгодно, ведь каждый пропущенный ход – это потерянные очки. Если один из игроков пропустил ход, это признак того, что с его точки зрения партия завершена, делать ходы не имеет больше смысла. Обычно на этом игра и заканчивается.

Го в миниатюре

Давно уже установлено на практике, что черные имеют небольшое преимущество по той же причине, по какой в шахматах преимущество имеют белые. Право первого хода! Легко доказать, что белые в го не могут иметь преимущества ни при каких условиях. Ведь если бы первым ходить было невыгодно, то черные могли бы просто пропустить свой ход и предоставить белым право играть первыми. Из права пропускать ходы логически вытекает преимущество черных или уж по крайней мере отсутствие преимущества у белых.
Это естественное преимущество черных издавна использовалось на Востоке для ранжировки мастеров игры в Го по данам. Белые слабее. И потому если кто-то играл против противника того же дана, то должен был на несколько очков побеждать при игре черными, но проигрывать при игре белыми. Это нормально. Небольшой проигрыш (в несколько очков) для белых не считается поражением. А более высокий дан доказывает свое принципиальное превосходство тем, что побеждает, играя белыми. Самый высокий дан – 9-й, самый низкий – 1-й. Но даже игрок первого дана - это уже мастер.
Мастера сражались между собой на большой доске (19*19). А те, кто ещё не был удостоен дана (звания мастера), соревновались между собой на маленькой учебной доске (13*13). Там использовался отдельный ученический рейтинг, где ранги назывались не «дан», а «кю». Самый высший ученический ранг – это 1-й кю. Продвинутый ученик уровня 1-го кю имеет шанс победить мастера 1-го дана, играя на большой доске черными. Если же это случается регулярно – это значит, что он становится мастером и скоро может получить свой первый дан. Второй, третий и далее кю определялись аналогично. Равные бойцы побеждают, играя черными, но проигрывают, играя белыми. Но 2-й проигрывает 1-му даже того, когда играет черными.
Эта древняя система ранжирования мне нравится, потому что она естественная: даны и кю определяются не произвольным соглашением, но свойствами самой игры. Правда, граница между «данами» и «кю» всегда была условна и зависела от местной традиции – на каком уровне ученику пора переходить на большой гобан. Первый японский дан соответствовал третьему корейскому кю. То есть, в Корее требования к «мастеру» были намного выше.
В наше время всё вообще делается несколько по-другому. Шансы белых и черных на победу теперь сравняли, используя самый простой и естественный способ. Белым дается несколько дополнительных очков в компенсацию за то, что они лишены права ходить первыми. Понятия «дан» и «кю» по-прежнему в ходу, но определяются иначе – подробности можно узнать, например, в Википедии. Современная система практичнее, но древняя интереснее и естественнее.
У современной системы есть и принципиальный недостаток! Дело в том, что никто до сих пор не знает в точности, сколько же именно очков следует давать черным за право первого хода. Игра Го насчитывает уже несколько тысяч лет, но это важное число остается неизвестным. В разных странах приняты несколько разные нормы. Где пять очков, где шесть, а где и семь. В международных соревнованиях белым дают пять с половиной очков. Эта «половина» с точки зрения математики абсурдна, так как преимущество черных – это некое конкретное целое число. Это число теоретически можно было бы вычислить, просто перебрав все варианты игры и найдя, к какому результату пришли бы черные и белые, действуя каждый со своей стороны наиболее оптимальным образом. Поскольку вариантов слишком много (гугль в кубе), эта возможность имеет чисто академический характер. И сколько очков давать белым - это определяется «на глазок», по-разному в разных странах, что довольно некрасиво.

Размышляя об этом числе, я задался вопросом, а нельзя ли его вычислить чисто теоретически, не перебирая варианты игры, но используя математический подход. Эта мысль подтолкнула меня исследовать игру Го средствами математики.
Идея заключалась в том, чтобы изучить свойства Го при игре на гобанах маленького размера, где можно осуществить перебор вариантов. На Востоке используют гобаны 19*19 и 13*13. Можно встретить также детский гобан 7*7. Игра на детском гобане сравнительно проста, здесь количество возможных партий Го не превышает число вариантов в Шахматах. Этот ряд чисел легко экстраполировать: 1, 7, 13, 19, 25, 31… (Кстати, иногда действительно играют на супербольшой доске, размером 25*25.) Это арифметическая прогрессия с шагом 6, которая начинается с тривиального «гобана» размеров в один-единственный пункт. Почему именно шесть? Мне кажется, тут два соображения. Вообще-то, исходя из практики игры, для Го имеет значение тройка. Занять третий пункт от угла значит наверняка овладеть этим углом (достаточно лишь отвечать, притом правильно отвечать на ходы противника), а борьба за углы – основа стратегии в теории Го. Если рассмотреть прогрессию с шагом 3 – 1, 4, 7, 10, 13, 16, 19, 22, 25..., из неё почему-то исключены все четные числа – 4, 10, 16, 22. Восточным людям претит гобан четного размера – было бы интересно понять, почему.
Одним словом, у меня возникло желание исследовать Го более абстрактно, рассматривая «гобаны» самого разного размера и формы. Если на простых примерах удастся понять связь между размером доски и преимуществом черных, то можно будет сказать точно, чему равно это преимущество на большой доске, даже не перебирая всех вариантов игры. Это вовсе не лишняя работа, ведь такой перебор никогда не будет возможным, как мы показали выше.

Го и математика.

Прежде всего, надо сказать, что «пустота» на гобане с точки зрения математики вовсе не является пустотой. Даже совершенно пустой гобан – это вовсе не пустота. Напомню, что графом математики называют любое множество (пунктов), на котором задано какое-то другое множество – множество пар (отрезков), соединяющих эти пункты. Пустой гобан – это граф. И в Го можно с тем же успехом играть на любом графе, любой формы, используя те же самые правила, которые используются в обычном Го.

Возьмем для примера самый-самый простой граф. Два пункта, соединенных между собой. Черные могут занять один из этих пунктов. Но если белые займут свободный пункт, то черный камень лишится «воздуха». Но при этом белый камень и сам лишится «воздуха». Кто-то из них должен умереть, но кто?
Тут возможны два варианта правил, две различных игры.
Можно запретить такие «самоубийственные» ходы, и тогда получится игра в «точки», которая была в моё время довольно популярна в советских школах. Она намного проще и не так интересна как Го, зато в неё можно играть на бумаге. Не нужны ни гобан, ни камни. Достаточно иметь лист бумаги в клеточку из школьной тетрадки и карандаш. Однажды срубленная фигура в этой игре погибает навсегда, так что игра обходится даже без стирательной резинки – срубленные фигуры можно просто зачеркивать. А любая фигура, внутри которой оказался пустой пункт или зачеркнутая фигура противника, тут же становится бессмертной. Её уже невозможно лишить «воздуха», так как она имеет внутреннюю пустоту.
Настоящее Го устроено интереснее. Оно более агрессивно. В описанной ситуации нападающая фигура остается на доске, погибает же фигура обороняющаяся. При игре на минимальном графе (из двух пунктов) это означает, что черный камень снимается, а белый остается.
Но теперь возникает новая проблема: черные могут так же точно «срубить» камень белых. И возникает цикл, повтор, который красиво выглядит, но создает проблему. Игра становится бесконечной и лишается смысла. Чтобы избежать этого бесконечного тупика, в Го вводят дополнительное правило, так называемое «правило Ко». Фактически, это единственное настоящее правило, регулирующее поведение противников. Все до сих пор перечисленные «правила», в сущности, не были в полном смысле правилами, так как они просто описывали ход игры и её цели. Правило же Ко – это настоящее правило, как в шахматах. Оно запрещает! Запрещается делать ход, в результате которого повторяется позиция, которая уже была на доске во ходе данной игры. Правило Ко запрещает повтор и требует необратимого поступательного развития игры. Игра должна двигаться вперед, а не топтаться на месте, возвращаясь назад.
Надо признать, что правило Ко чуть-чуть меня разочаровывает. Игра Го поражает отсутствием запретов. Можно ходить куда угодно и можно пропускать ходы. Можно всё. Но вот повторяться – нельзя. Здесь Го становится чуть-чуть, самую малость похожим на шахматы, ведь шахматные правила состоят в основном из запретов. Конь не может ходить как слон, а слон – как конь, и так далее. Оказывается, в Го тоже можно не всё, но ПОЧТИ всё, и это «почти» немного огорчает.
Итак, го на простейшем графе приводит черных к неизбежной катастрофе. Белые рубят черный камень, а черные не могут ответить тем же, поскольку это привело бы к повтору уже бывшей позиции. Таким образом, граф остается целиком во власти белых, черные проигрывают два очка. Потому единственная разумная стратегия черных – пропустить ход, предоставив белым сделать эту глупость. И белые должны поступить так же точно. Обе стороны пропускают ход, игра закончена. Что же в результате? Мы обнаруживаем, что простейший граф, граф-отрезок, не дает черным никакого преимущества первого хода. Го на отрезке имеет нулевой результат.
(Строго говоря, для полноты картины надо бы рассмотреть и тривиальный граф, состоящий из одной-единственной точки. Жить там невозможно, «дышать» нечем. Потому на тривиальном графе черные тоже не имеют никакого преимущества.)

Следующий по уровню сложности граф состоит из трех пунктов. Тут есть два варианта. Либо это треугольник, либо отрезок с пунктом посередине.
Во втором случае, черные немедленно занимают центр, и белые проиграли. Они не могут срубить черных, потому что у тех в любом случае остается «воздух». В го это называют «фигура с двумя глазами». Глаз – это пункт или маленькая территория, полностью принадлежащая данной фигуре. Если у фигуры два глаза, то она бессмертна. Если только один глаз, то её можно убить, заняв этот глаз. Итак, три точки на одной линии дают черным преимущество в три очка. А как ведет себя треугольник? Задача о треугольнике оказывается непростой.

Я сделал небольшую гифку для иллюстрации этого. Её можно скачать здесь и просмотреть при помощи браузера.

У меня даже возникает соблазн написать, как это принято делать в научных статьях: «недолго подумав, нетрудно убедиться». Так пишут в тех случаях, когда убедиться на самом деле довольно трудно, и авторам статьи неохота тратить силы на объяснения.

Итак, "недолго подумав, нетрудно убедиться", что на треугольник чёрным лезть не рекомендуется. Лучше всего сразу пропустить ход, потому что кто начнет борьбу первым, тот обречен на неминуемое поражение, если только противник не будет делать ошибки. Вы gif-ке сверху на нарисовал, как должны действовать черные, чтобы прожить на доске как можно дольше. И как должны действовать белые, чтобы всё-таки выжить чёрных с треугольника. Повторяю: чёрные допускают непоправимую ошибку, вообще начиная игру. Но если они уж начали её, нужно действовать так, как я показал. При этом на доске последовательно появляются ВСЕ возможные варианты позиции (их 19, включая пустой граф). Черные проигрывают, если белые загоняют их в позицию, когда ответить на удар запрешает правило Ко. Как бы черные ни старались, белым это удастся. Любое уклонение от этой страгегии лишь приближает неминуемую смерть.

Но и белые - если сделают хоть один неверный ход, не добьются победы.

[Кому не лень потратить время на проверку этого утверждения.]Итак, допустим, черные попытаются застолбить себе место и займут одну из вершин треугольника (любую из трех!). Но тогда белые немедленно занимают другую вершину (любую из оставшихся двух!). Если черные рубят белый камень, занимая последний оставшийся свободным пункт, то у них получается фигура с одним глазом, и белые немедленно выбивают этот глаз. Позиция выглядит так, словно это белые сделали ход первыми. Теперь у черных два варианта. Если они займут прежний пункт, то белые немедленно срубят их камень, и черным придется смириться с поражением, так как срубить белых им теперь запрещает правило Ко! Если они займут не прежний, а новый пункт, то они смогут срубить белых, так как ситуация пока не повторяется. На доске будет снова стоять одинокий черный камень, но уже на новом месте. Белым нельзя в ответ занимать старое место, иначе правило Ко обратится против них и приведет их к поражению. Потому они займут новое место, и вся картина игры в точности повторится с поворотом на 120 градусов. А потом ещё раз, и… черные все-таки потерпят поражение, потому что после второго поворота получается поворот на 360 градусов, то есть повтор! Повторяться нельзя, и черные терпят поражение. (Недолго подумав, нетрудно убедиться)
Каков вывод? Если черные заняли пункт, а белые ответили им, то далее черным нельзя рубить белых! Это ведет к неизбежному поражению, если белые не допускают ошибок. Но если черные пропустят ход, то белые их просто срубят, а ответить черным запрещает правило Ко. Таким образом, мы доказали, что черным лучше вообще не лезть и на треугольный граф! Они должны пропустить ход, и если белые сделают глупость и попытаются занять пункт, то неизбежно проиграют при правильных ответах черных. Таким образом, треугольный граф следует оставить пустым. Он не дает черным никакого преимущества так же, как и отрезок.


Что общего между отдельной точкой, отрезком и треугольником? То, и другое, и третье – так называемые полные графы. Полный граф – это граф, в котором каждый пункт связан с каждым пунктом. Возникает гипотеза, что на всяком полном графе тот, кто делает ход первым, терпит неизбежное поражение, если только противник придерживается правильной стратегии. Правильная стратегия заключается в том, чтобы загонять противника в тупик, используя правило Ко. Итак, гипотеза: идеальная стратегия Го на любом полном графе заключается в пропуске хода. Если так, то сама возможность победы в Го обусловлена неполнотой графа. Доказать правильность этой гипотезы в общем виде мне пока не удалось, но не удалось и придумать опровергающего её примера.


Если среди моих читателей найдется кто-то, кого серьезно заинтересовали эти проблемы, могу рекомендовать для дальнейшего чтения исследование http://erikvanderwerf.tengen.nl/pubdown/solving_go_on_small_boards.pdf
Tags: го, математика
1
*****И вот, оказывается, что ТАКОЙ интеллектуальной мощи человек противостоять неспособен. В тот день, когда я осознал это, мой мир изменился. Я поверил в роботов и приготовился к тому, что спустя некоторое время они овладеют всеми человеческими профессиями. Надежды больше нет. Я увидел чемпиона мира по Го побежденным железякой, и осознал, что дивный новый мир уже наступил.

как ни странно, эта железка такой же тупой и осталась ни смотря на выигрыш в го )
Точне не тупой, а "надроченной на выполнение одного трюка".

Есть назвать ИИ правильно, "сверхсложный алгоритм", пусть и созданный машинным методом, то он звучит гораздо менее круто.
Под такое инвестиций не получишь!
*** "надроченной на выполнение одного трюка".

можно и так сказать
Беда в том, что в жизни есть сравнительно небольшой набор жизненно-важных трюков, и есть железяка превзойдет человека последовательно в каждом из них по отдельности, то в совокупности мы будем иметь уже совершенно иную реальность.

Я не верю в "искусственный разум". Разум и интеллект - это две разные вещи. Но чтобы править миром, достаточно и одного интеллекта.
По Вашему посту естественно возникают два вопроса о противостоянии человека с ИИ в Го:
1) каково это будет на еще бОльшей доске? Может, даже современной мощи ИИ не хватит на доску 25x25, а для человека (мастера) такой огромной разницы не будет, и человек обратно выиграет?

2) как изменится сама игра, и уровень в ней ИИ, если склеить края, сделать топологически тор?

В свое время я написал сапера на торе - обычный с краями был уже очень скушен. И это оказалось очень занятно.
Боюсь оказаться плохим предсказателем, но рискну: колоссальное количество партий, которое компьютер может сыграть сам с собой достаточно быстро (в календарном смысле) позволит ему обыгрывать любого мастера, которому тоже нужно "переучиваться", увы.
Ну, понятно, что через некоторое время наверстает, да.
Но вопрос - через какое?
навскидку, увеличение поля с 19 до 25 меняет пространство игры на МНОГО порядков, и примерно на столько же порядков больше потребуется времени (или выч.мощности/скорости) программе для само-тренировки. Если это в 10 раз, то конечно это не меняет погоды. А вот если в миллиард раз - то уже не при нашей жизни. Не за одну секунду же Альфа-Го само-натренировалась до того уровня, когда смогла обыграть Ли Седоля.

С другой стороны, та самая человеческая интуиция может оказаться вполне применимой и к бОльшему полю без длительного переучивания.

То есть, мне кажется, интересно было бы попробовать.
Неубедительно.
1. Я не уверен, что "на голой интуиции" человек сохранит тот же "класс игры" при увеличении поля. Боюсь, понадобится именно "перестройка интуиции"
2. "... на столько же порядков больше потребуется времени (или выч.мощности/скорости) программе для само-тренировки..." - не так. Даже одна единственная самотренировка мизерно, но повышает "класс игры" для нейросети. И не факт, что нужно мильярды тренировок. Нейросеть (как мне кажется) обучается плавно - график роста ее интеллекта в зависимости от числа эпох, полагаю, имеет характер кривой типа логарифма (моя фантазия, на самом деле - не знаю).

А вот человек (и вот тут видел неоднократно) - развивается скачкообразно.
"Тыщу партий" - и никакого сдвига, а потом бац, что-то пропёрло в мозгу и качественный скачок.

И да, конечно же, интересно было бы попробовать...
Ну да, неубедительно, я тоже не спец в нейронных сетях, так что это все гадания на кофейной гуще.
Спец - не спец... не в этом суть, как мне кажется.

А в том, что даже сколь угодно хорошо обученная нейросеть, это НЕ ИИ. Точнее, искусственный, конечно, но не интеллект (ИМХО).

Мне кажется, что это скорее "надроченная" и формализованная (в значениях своих параметрах) сеть это скорее "искусственная интуиция", чем "искусственный интеллект"
В том, что это не интеллект, согласен, и потому и считаю, что на поле 25 на 25 вероятнее превосходство человека.
Называть ли это "искусственной интуицией" - не знаю.
"...считаю, что на поле 25 на 25 вероятнее превосходство человека..."
Ой, не факт...
Судя по тому, что я сегодня почитал про АльфаГо (в разных реинкарнациях) эта зараза (ИИ) уже человека обставила (во всех формализуемых задачах; поэтому, в частности и не интеллект).

А 25 на 25, или 50 на 50 - принципиально ничего (для компьютера), полагаю, не меняется .

Тут не перебор же, экспоненциальный рост количества вариантов ни разу не аргумент...

Кстати, предлагаю.
Новая игра - "Го на бесконечном поле", с ограничением количества ходов (скажем, по 1000) и "твоя" территория - только то, что ты замкнул.
Нюансы нужно уточнить, но идея, полагаю ясна.

Так вот, не сомневаюсь, что ИИ и в нее человека обыграет
Интересная идея.

Думаю, да. Обыграет, поскольку количество ходов ограничено.

alex_dvorak

June 19 2018, 13:57:30 UTC 1 year ago Edited:  June 19 2018, 13:59:06 UTC

А как можно не ограничивать число ходов?
Хотя... можно поставить цель - окружить себе 100 (или 1000) клеток.
Так, пожалуй, даже лучше...
Да, съеденные фишки - то же, что и окруженные клетки...
Выигрывает тот, кто первым набрал нужное количество очков?
Именно
Для начала можно задать совсем небольшое количество очков. Скажем, десять.
И попробовать поиграть, чтобы почувствовать эту игру. Может быть, черные всегда будут выигрывать?
Понятно, что в таком случае игра, в принципе, может быть бесконечной.
Интересно, есть ли у нее "ничейный алгоритм" для тех, кто ходит вторым?
Да, или право первого хода гарантирует победу?
Гораздо интереснее, если окажется, что
- "победной стратегии" для черных нет
- "ничейной стратегии" для белых тоже нет.
Между прочим, вполне возможно.
Хотя и маловероятно.
Ох. Еще раз - разумеется, для АльфаГо разница в размере поля чисто количественная. Вопрос только, каково это количество. Я недостаточно понимаю устройство АльфаГо, чтобы оценить, насколько для нее возрастает чисто вычислительная сложность с размером поля.

Насчет того, что там не перебор - Вы ошибаетесь, перебор.
Нейронная сеть "всего лишь" обучена оценивать позицию как целое, чтобы отсекать неперспективные ветки перебора.
И тут есть по меньшей мере два места, где чисто механическая трудоемкость задачи для АльфаГо возрастает - 1) для оценки позиции на поле большего размера нужна бОльшая нейронная сеть, которая для одного "такта" работы может требовать на порядок больше тактов процессора, и на порядок больше памяти. 2) само дерево вариантов, которое никуда собственно не делось, стало на много порядков более разветвленным.

Ведь если доля позиций, недостойных внимания, останется такой же, масштаб перебора вырастает ну очень сильно.
А сходу кажется, (правда я не бог весть какой игрок в Го, но тем не менее) что должна остаться примерно такой же, по порядку величины.

Абсолютное количество достойных внимания позиций не сильно вырастет с ростом размера доски только на самых первых стадиях игры, когда доска еще почти пустая. Когда заполненность доски достигнет примерно 10-20%, кажется, что уже не абсолютное количество достойных внимания продолжений будет примерно таким же, а их относительная доля - а это и означает увеличение дерева вариантов на многие многие порядки.

Экспоненциальный рост механической сложности задачи для АльфаГо очень даже аргумент - потому что сейчас АльфаГо может выигрывать у людей просто потому, что она находит лучшие ходы за меньшее время. Если для нахождения лучших (чем у лучших мастеров из людей) ходов ей потребуется в миллиард раз большее время, чем человеку, то она уже не будет играть лучше человека.
Убедительное рассуждение.
Приведу в ответ свои собственные соображения по этой теме.

Насколько я понял принцип обучения нейросети, она играет сама с собой, доводя партию до конца и в зависимости от исхода повышает или понижает вероятность того или иного решения в аналогичной позиции для следующего раза. Длина партии в Го растет примерно пропорционально площади доски. Значит, затрата времени на одну партию 25*25=625 сравнительно с 19*19=361 возрастает всего лишь в два раза. То есть, это вообще не критично.

Теперь соображение по количеству вариантов для перебора.
Если исходить из теории игр, в каждой данной позиции как правило можно сделать несколько(много) хороших ходов, не являющихся ошибкой. То есть, неважно, как ходить. Главное - не делать ошибок. Проигрывает тот, кто допустил ошибку. Если ошибаются оба, проигрывает тот, кто допустил больше ошибок или более тяжкие ошибки. Суть самообучения в том, чтобы научиться видеть ошибки, избегать ошибок самому и пользоваться ошибками противника. Если противник не ошибается, победить его нельзя. ("Возможность победы зависит от противника. Непобедимость от тебя самого.")

Потому для обучения критически важно, чтобы Сеть сделала как можно больше ошибок и зафиксировала, "осознала" их. Именно ошибки составляют суть обучения. А трудность обучения в том, что если ошибки допускают оба противника, то они взаимно компенсируются и остаются невыявленными. Для обучения полезно играть с противником, который сам не допускает ошибок и не прощает ошибок тебе. Отсюда да же и основная трудность самообучения.
Не касаясь конкретной реализации (в АльфаГо) выскажу такое возражение:

Исходя из Вашей логики обучить нейросеть играть на "бесконечном поле" невозможно в принципе?

Смею Вас заверить, это не так. Во всяком случае, я бы взялся пообучать...
("Зъисть то вин зъисть , та хто ж йому дасть" :-) )

Возвращаясь к АльфаГо - ее главная (как по мне) идея, которая позволила достичь успеха - использование "стратегической" и "оценочной" сетей .
После минимальной перестройки логики (как я вижу), именно они будут практически инварианты к размеру доски

Грубо говоря, нужно будет учесть параметры ("близко-далеко от угла", "близко-далеко от прямого края") и если оба "далеко" то...
И нейросеть очень быстро (в ее понимании) нащупает что такое "близко-далеко"

А роль перебора после глубины перебора, скажем, в 10-15 ходов (условно) вообще уходит в ноль.

Давайте останемся при своих.
Без углубления в алгоритм АльфаГо и прямых экспериментов это обсуждение дальше будет пустым переливанием воды. Углубляться у меня времени нет, если честно.
Согласен. При своих.

Но, вообще-то ситуация мне напомнила "баян" советских времен:
Два алконавта убедили проходящего товарища в очках, шляпе и при портфеле скинуться с ними по рублю (ну настроение у него было такое, легко дал себя уговорить). После разлития по соответствующему количеству булек на брата в ближайшем парадном, товарищ взял портфель и решил откланяться, но был решительно остановлен коллегами: "Ты, это, куда??? А попиз поговорить???"

Булек, увы, не было, но и ЖЖ, согласитесь, не то место, чтобы углубляться. Так, поговорить....
При наличии времени, естественно.
Почему нет?
Лично мне так больше нравится, чем "интеллект".
Но убедительней аргументировать не могу :-)
> не уверен, что "на голой интуиции" человек сохранит тот же "класс игры" при увеличении поля. Боюсь, понадобится именно "перестройка интуиции"

Я играл на досках разного размера, и по моему ощущению, тут все меняется очень плавно. Игра 25*25 кажется очень похожей на игру 19*19. Впрочем, я не мастер и мои суждения стоят недорого.
Если говорить о простом количестве возможных позиций на доске, зависимость там экспоненциальная:

1x1 1
2x2 57
3x3 12675
4x4 24318165
5x5 414295148741
6x6 62567386502084877
7x7 83677847847984287628595
8x8 990966953618170260281935463385
9x9 103919148791293834318983090438798793469
10x10 96498428501909654589630887978835098088148177857
11x11 793474866816582266820936671790189132321673383112185151899
12x12 57774258489513238998237970307483999327287210756991189655942651331169
13x13 37249792307686396442294904767024517674249157948208717533254799550970595875237705
14x14 212667732900366224249789357650440598098805861083269127196623872213228196352455447575029701325
15x15 10751464308361383118768413754866123809733788820327844402764601662870883601711298309339239868998337801509491
16x16 4813066963822755416429056022484299646486874100967249263944719599975607459850502222039591149331431805524655467453067042377
17x17 19079388919628199204605726181850465220151058338147922243967269231944059187214767997105992341735209230667288462179090073659712583262087437
18x18 669723114288829212892740188841706543509937780640178732810318337696945624428547218105214326012774371397184848890970111836283470468812827907149926502347633
19x19 208168199381979984699478633344862770286522453884530548425639456820927419612738015378525648451698519643907259916015628128546089888314427129715319317557736620397247064840935


Так что 25*25 - это сложнее чем 19*19 не в миллиард раз, а где-то в квадрат раз. А человеческая интуиция (как мне кажется) работает примерно одинаково, независимо от размена доски. Так что вполне может быть, что Вы и правы.
"...человеческая интуиция (как мне кажется) работает примерно одинаково, независимо от размера доски..."
Да, согласен. Для нашего уровня (сорри, предполагаю, что разница в нашем уровне для Мастера практически незаметна, хотя Вы, несомненно, меня и обыграете). Вот только класс игры - он не сводится к интуиции (ни стопроцентно, ни даже на 50%).
Это некий "сплав" интуиции, опыта, чувства прекрасного (искусственно развитого!) техники просчета (зачастую даже вбитой в подкорку, но можно ли это считать интуицией? Люди-счетчики в доли секунды перемножающие многомногомногозначные числа, или извлекающие немыслимые корни - это что - "интуиция"? )

Впрочем, по Вике, Интуи́ция (позднелат. intuitio — «созерцание», от глагола intueor — пристально смотрю) — способность, свойство человека понимать, формировать и проникать в смысл событий, ситуаций, объектов посредством инсайта, озарения, единомоментного подсознательного вывода, основанного на воображении, эмпатии и предшествующем опыте, «чутьё», проницательность.

Наверное так, утрируя - "всё что подсознательное - это интуитивное!"
Значит и люди-счетчики - "интуиты". Хм. Ладно.
Но этот пример опровергает тезис, что "человеческая интуиция работает примерно одинаково"
Ох, сильно неодинаково... И не только в размере доски дело, похоже.

Я тоже "не мастер" (и не только в го).
Но общаясь с Мастерами пришел к выводу, что мыслят и чувствуют ( и "интуичат") они в своей области сильно-сильно не так.
Я хотел лишь сказать, что мастер будет мастерски играть на доске любого размера. Принцип-то везде один и тот же. Хотя и нужно какое-то время чтобы осмотреться, привыкнуть к новому масштабу событий, нащупать соответствую этому масштабу стратегию.

И да, для меня интуиция - это всё "подсознательное". Действительно, это способность, свойство человека понимать, формировать и проникать в смысл событий, ситуаций, объектов посредством инсайта, озарения, единомоментного подсознательного вывода, основанного на воображении, эмпатии и предшествующем опыте, «чутьё», проницательность. Это определение вполне соответствует моей интуиции :)

При этом само "подсознание" является, как мне кажется, омонимом, включающим в себя несколько совершенно разных по природе вещей: Сознание и бессознательное.
Про роль масштаба.
Не совсем.
Да, МСМК по футболу будет мастером (по сравнению с перворазрядниками) и на площадке по мини-футболу и в пляжном футболе. Но останется ли он Мастером - сильно не факт.

Про подсознание. Спасибо за ссылку, прочел с интересом. Пока не осознал ( :-) ), поэтому от комментариев, вопросов и, тем более дискуссии, пока воздержусь.

Про интуицию. С определением ни в форме "интуиция это синоним для подсознательного" ни в более развернутом виде, соответствующем Вашей интуиции, не согласен.
Не в плане дискуссии (спорить об определениях - бессмыслица полная), а в плане прояснения своей точки зрения скажу, что для меня интуиция - это способность делать выводы, выносить заключения, делать прогнозы при заведомом недостатке информации для и/или невозможности их логически обосновать.
Хорошая интуиция - выводы и прогнозы оправдываются, плохая - ... понятно.
А инсайт, эмпатия, чутьё, "проникать в глубинную суть"... это всё лирика.

Поэтому "счетчики" - это не интуиты. У них и информации достаточно и логически обосновать результат они тоже в состоянии (вот только долго это). А то, что они не знают, как именно они к нему (к результату) пришли за доли секунды - отдельная тема .
Вот если счетчик мне скажет сколько будет "пи в степени е", не зная что такое "пи" и "е", или что такое степень - то это да, это интуиция
Игра на торе - это совсем другая игра, с другой стратегией. Первый ход черных в ней может быть только один (в силу симметрии), и все дальнейшее определяется ответом белых. То есть, на торе инициатива игры изначально в руках белых. (В то время как на обычной доске тон игре задает первый ход черных.) И это любопытно!

Хорошая идея.
То есть, даже на уровне интуиции ясно, что игра на цилиндре и на торе - совсем не то, что на плоской доске.

Я бы сказал, что игра на торе - "чистое" го!
Схватка тактик (и стратегий) без краевого эффекта и углов, которые, что ни говори, привносят...

Не просто хорошая, а замечательная идея!

На самом деле игра в точки более совершенна и гармонична, чем го. Так как в ней - бесконечное поле, и нет необходимости в правиле ко. Основа стратегии в го - борьба за углы и соблюдение правила ко (еще один "угол"). То есть, не свободное мышление, а борьба с заданными рамками. Го - всего лишь адаптация точек к ограниченному игровому полю и ограниченному числу камней. Именно поэтому камни в нем не умирают навсегда, а то ставятся, то снимаются.
Истинная модель свободного стратегичекого мышления - точки. В них все, как в жизни - каждый ход необратим, а то, что умерло - умерло навсегда. Но наши мертвые неудавшиеся замыслы - фундамент для новых побед в бесконечном космосе возможностей. Интересно, смог бы ИИ обыграть человека в точки? : )

> Основа стратегии в го - борьба за углы
- это неверно.
Можно легко захватить углы ... и сдать все остальное

a_lazar

June 18 2018, 13:25:37 UTC 1 year ago Edited:  June 18 2018, 13:28:23 UTC

Для определения прпвильного коми надо просто запустить 10е6-10е9 игр Альфаго самой с собой.
До конца, без сдачи.
И посчитать среднее преимущество черных.

А, пожалуй, и 10е4-10е5 достаточно.
А в какой именно степени - это сравнительно просто проверяется, анализируя устойчивость результата и скорость сходимости.
Если ИИ уже достаточно "надрочен", то, подозреваю что и по тысяче партий уже можно оценить "правильный" коми с хорошей точностью.
Вот только стоит "запустить в дело" другую нейросеть (не менее обученную) и, скорее всего, прошлый результат станет невалидным.

Кстати, интересно, а чемпионаты между ИИ по ГО близки? Или АльфаГо пока (и надолго) - вершина?

a_lazar

June 18 2018, 14:35:16 UTC 1 year ago Edited:  June 18 2018, 14:36:45 UTC

> Вот только стоит "запустить в дело" другую нейросеть (не менее обученную) и, скорее всего, прошлый результат станет невалидным.
- а тут вопрос, насколько они будут отличатся (и в каком диапазоне).
Если 6,23 vs 6,37, то не пофиг ли?
Все равно 6,5.

Вот если 5,97 vs. 6,15, то уже не пофиг.
Ибо в первом случае - 5,5, а во втором - 6,5.

Хотя, не, в таком случае, по справедливости, надо возвращать целое коми и ничейный исход.

(Впрочем, и 6,23 тогда ближе к 6 при)
А никто ж не мешает и комми трансцедентным числом устанавливать - например два пи. Не пофиг ли?

a_lazar

June 18 2018, 14:51:02 UTC 1 year ago Edited:  June 18 2018, 14:52:07 UTC

Так коми в диапазоне от 5.0...01 до 5.9...9 неразличимы для результата
Если у белых 50 очков (по территории), а у черных - 55 (разница в 5 очков и менее), то, с учетом этого коми, победили белые, если 6 и более - черные.

2 пи - это те же 6,5.

Речь исходно о том, чтобы выбрать из трех исползуемых значений: 5,5 , 6,5 и 7,5.
Теоретически ИИ может чудануть и выдать 4,5 или 8,5.
Хотя вряд ли.
Так коми в диапазоне от 5.0...01 до 5.9...9 неразличимы для результата

Для одной партии - да, неотличимо.
А если речь идет о статистике - тыщу партий и счет 500:500, то общую победу по очкам считают ? (я просто не в курсе, как принято)

"Речь исходно о том, чтобы выбрать из трех исползуемых значений: 5,5 , 6,5 и 7,5."
Ну, с такой точностью, полагаю результат будет устойчивым (в борьбе ИИ "сам с собой")
Но не факт, конечно же, голову не закладывал бы (даже палец :-) )

palaman

June 18 2018, 17:45:29 UTC 1 year ago Edited:  June 18 2018, 18:08:22 UTC

> Теоретически ИИ может чудануть и выдать 4,5 или 8,5.

Раньше мне это казалось крайне маловероятным. Но последнее время я вполне допускаю такую возможность. Дело в том, что на маленькой доске (4*4) можно тупо перебрать все варианты и определить идеальную стратегию для каждого из противников. И это уже сделано. Так вот, идеальная стратегия игры оказывается крайне агрессивной и непохожей на (сравнительно) мирную игру великих мастеров. Там все висит на ко и на сэки. В идеальной игре противники буквально выжимают друг из друга последние соки и в результате зверской мясорубки ко-борбы их фигуры остаются полуживыми без двух глаз лишь благодаря тому, что пртивостоящие им фигуры противника тоже выжаты как лимон.

Вполне возможно, что идеальная стратегия на большой доске носит такой же жуткий, смертоносный характер. Машина уже чуть-чуть показала нам такого рода зубки: Дэвид Ормерод пишет, что просмотр третьей партии Ли с AlphaGo заставил его почувствовать себя «физически нездоровым». Не исключено, что это только первая ласточка, и настоящее Го совсем непохоже на ту сравнительно (!) мирную и красивую игру, к которой мы привыкли, глядя на партии мастеров.

И кто знает, каким окажется тогда правильное коми?
Правильное коми - это целое число!
Ведь если перебрать все варианты (теоретически), то можно найти решение игры. И оно будет однозначным: черные побеждают с таким-то счетом. Точка.
> Кстати, интересно, а чемпионаты между ИИ по ГО близки? Или АльфаГо пока (и надолго) - вершина?
- наверно, (мощные) нейросети просто бросят на что-то более практичное.
Так что, может, и надолго вершина.
Не-не-не...
О практичности - тут проверяются прежде всего алгоритмы обучения.
А на какой (практической, или игровой) задаче - почти пофиг.
При одинаковой мощности компьютеров и размерах нейросетки - мильён тактов для обучения, или мильярд - разница, однако...

palaman

June 18 2018, 17:31:36 UTC 1 year ago Edited:  June 18 2018, 17:33:56 UTC

Нет, они уже продвинулись дальше: https://ru.wikipedia.org/wiki/AlphaGo#AlphaGo_Zero

Но после того как последняя модель, AlphaZero, достигла заведомо недостижимого для человека уровня, работы в этом направлении свернули (по крайней мере, официально).
На гобане с чётным числом линий играть будет невозможно. Игра выродится, всё будет решать преимущество первого хода.

palaman

June 18 2018, 17:32:47 UTC 1 year ago Edited:  June 18 2018, 17:33:26 UTC

Не вижу, почему это должно было бы произойти. Я играл на четной доске разного размера (2*2, 4*4, 6*6), и не заметил никакой "вырожденности". Я что-то пропустил?
Спасибо!
После Вашего прошлого поста я таки решился познакомится с Го. По началу проблемой была именно заточенность мозга под "точки" , и, как Вы верно заметили, агрессивность Го. Пока, так и не понял очень многого в игре.
Одако, без этих попыток играть этот пост не был бы так интересен😁

palaman

June 19 2018, 07:33:23 UTC 1 year ago Edited:  June 19 2018, 07:36:27 UTC

Го - игра многослойная и, судя по всему, неисчерпаемая. Агрессивность как таковая свойственна поначалу всем новичкам. Но человек очень быстро убеждается в том, что нападать опасно, и нападение часто приводит к смерти нападающего. И начинает потихоньку учиться жить. Это "умение жить" и составляет суть обучения Го вплоть до 1-го дана. Дальнейшее описано вот здесь (рекомендую). Скажем так, это умение не просто жить, а хорошо жить. Но вот что интересно: на самых высоких уровнях снова обнаруживается агрессивность этой игры, только теперь уже тонкая, скрытая, коварная. Искусство манипулировать противником, навязать ему свою стратегию, заставить действовать в твоих интересах. Как сказано: "Если не можешь подавить, возглавь" - а того, кто умеет жить, и притом хорошо жить, просто невозможно подавить (не говорю уже "убить", убить - мечта новичка).
До умения жить я уже дошёл, но дальше, боюсь, потребуется очень много времени, чтобы почувствовать и остальные этапы. Интересно, а можно ли манипулировать простыми ботами? Или это только с людьми получается?
Ботами манипулировать, наоборот, намного проще, чем людьми!
В полном графе нельзя отхватить кусок территории, там все места одинаковы, и все дают жить, поэтому, если ходы не пропускать, размер графа полностью определяет последовательность конфигураций без учёта порядка, т.е. троек X=(black,white,empty), и выигрышей, т.к., зная текущую тройку X, можно назвать и следующую и предыдущую. Значит цикл детерминирован, начинают его черные, и завершить его должны тоже чёрные. То, что число снятых камней за цикл у чёрных и белых равно тоже понятно, т.к. число ходов равно, и начальная с конечной конфигурации без учёта порядка совпадают. А значит, максимум, через столько циклов, сколько есть мест, конфигурация полностью повторяется, но последний уравнивающий ход черные совершить не могут.
Это если ходы не пропускать.