升4段後有感,這是有關圍棋的心路歷程

2020-08-19
遊藝, pick-up

趁夜醉把這段文字輸出來。

這是有關圍棋的心路歷程。

我從很小(幼稚園時期)就會下圍棋了。我很喜歡它。
以至於每次去書店都會找相關的書看,那時候就已經能理解三四線的分別。
在小學中會下的人不多,願意深入地思考怎麼對戰的人就更少了。直到家裡的電腦可以上網,才開始在 msn.com 找到人一起玩。那時候大約和初始賬戶的等級分相近,對奕上還算是個初學者水平。

直到中學,為了找到一起玩的人幾乎沒有考慮就選定了要參加棋會。而在那時,我才真正地有定時地和一個同學和一個學長下棋。學長為人很冷酷,有點不待見我這個反主流的人,而且棋力比我高兩三級。我印象中一次都沒贏過他。反而和另一個實力比較相近的同學成為了日後,以至在大學和出來社會後都會聯絡的朋友。其主要核心,就是我對「手談」這兩個字的深深認同。

該同學C,和我的姓氏的首字母一樣。他比我相對於用棋局來交談更重視每一手對棋局的影響。但我在他的手段和對日本舊六超的理解中我對他也有了一般交流下不易得到的了解。

我認為現代圍棋的發展大概可以分為兩個時期,一個是李昌鎬前,一個是李昌鎬後。

李昌鎬前是日本六超最後的光輝,而李昌鎬的細殺和計算,也是像打破魔鏡一般地完結了以美型和風格作為自己的標誌的年代。

我是很慶幸我在這麼早就會下圍棋,能讀到六超對佈局這麼有趣的解釋。那種類似於魔法的非定量解釋,是數學和美學中間的橋,是後alphago 時期不會再有九段棋手再寫的東西。

直到來日本前,我對圍棋都是一個由高而低的思考:
除了基本的刀五葡萄六,宏觀上我就只會先撈後洗,務求先在開局就領先。而對手的模樣變得足夠大時,用治獨來破空是必然會因為對方的薄味而成功的。利用薄味也是圍棋最要求觀察力和創造力的階段之一。

這種在現有的框架下有著有意義有目的卻又無窮無盡的創新,實在令我單單是說出來已想再下一局。

但一直只是享受,而沒有有系統地輸入一些比較硬的記憶和習慣的我,對戰成績上沒有半點精進。

現在隨便就能想到幾個以前的開局的具體問題。但我想總結起來就是:我只追求勝利,卻沒追求勝率。這個勝率不是指多局下來的勝利比率,而是同一局中可以得勝的機率。

圍棋的下一手可能存在最佳的,但這個最佳因人而異。誠實地了解自己的思考深度可以到達何方,而去不多不少地打出這一手因自己能擴張的極限。

這一手不單是對對手的詢問,也是對自己的詢問。(下面這句是離題的事實:對自己誠實後,在有必要欺騙對手時才會可信。這有一點點像德樸中立人設的概念。)

而我發現這點時,我已經很多年沒下棋了。上一次已經是和弟弟和母親在舊居中,拿著AI 溜狗的情景。

再拿起來是兩年多前剛到日本,來日本其中一個小小的原因是因為有比較密集的棋室,可以進去輕鬆地在不說話的情況下手談。

在進去前幾天,我就在PlayStore 隨便找一隻可以網上對戰的圍棋遊戲。那時候玩的是go wars。(這是一隻畫面十分精美,在系統上也會為這個核心玩法加分的遊戲,但賬戶管理有點bug)

我想那麼多年沒下棋,先從最低級開始打起,看看自己打到甚麼位置,那麼在棋室為自己定級和定讓字也有個參考吧。

於是,我開始了一連串從沒有過如此密集對局。

在一個很喜歡的youtube 頻道「抖抖村」,DDM 大王說過一句令我多次受用的名言:當你發現你在瓶頸無法突破時,就是時候回去做基礎練習。

不只一次,他提醒了我:在基礎練習中你會發現自己的不足。

在達成很高的抽象總結後回頭去打磨基礎的技藝無論在畫畫還是在理解計算機科學的過程。都是很有價值而且常會生效的事。這也是大學教育比起專科教育優勝的地方。

回到圍棋,因為Go wars,我在幾週來打了數百場的對局,這個對局量好像已經超過往日做過的對局。我一直相信幾次深刻的思考比起無數次的淺度思考有價值得多。但這次圍棋的練習令我改變了這個想法。

深刻的思考固然可以強化自己的最大思考深度,記憶暫存等等。但是,為自己的限時內得到最優解的*策略*並不是天生就能最佳化的。

這次的調整,令我在一個月間上升了幾乎9級的棋力。我深信中盤的計算力上我是永遠不能和十幾歲時的我企及的。但那個時候,我已經深深體驗到這精深的遊戲在粗淺的抽象化後所得到的很多指導。

例如:早期的保守或者懶惰,在同樣的空間下,在後來只能被逼冒險。
貪婪必要補救,否則自然會被懲罰等等。

於是,我開始玩13路。361平方單位,對我來說是有點太大了。尤其在手機上。

慢慢地,我掌握了幾個很簡單的定式,掌握定式只是為了不被太多佔便宜。這也是我突然突飛猛進的原因。但我也不知不覺地在殺掉這個浪漫的遊戲。

我知道圍棋的對戰是很多方面的能力和知識的結合,角部定式是其中之一。我也在oseronia 中嘗試尋找過幾乎所有的變化。但這不是我喜歡的遊戲過程,要比拼字典的厚度的話,去參加scramble 或者Countdown (然後串出TNETENNBA)即可。

不過我卻突然對這種經驗效益強大的知識點上癮了。我沒有像以往追求通解,而是轉為滿足於局部最優。在TFT 中也一樣。

這一方面是AI 的發展和每年幾千篇在利用的梯度下降水出來的論文把我說服了,
還是這是大自然在告訴我是生命並不永久嗎?

以上