알파고 공략법 찾은 이세돌, 5국도 승리한다

김형중 기자

기사입력 2016-03-14 10:46


◇이세돌 9단이 '선(先)실리, 후(後)타개' 전략으로 첫 승을 거뒀다. 4국이 끝난 뒤 기자간담회에서 이 9단이 환하게 웃고 있다. 사진제공=한국기원

이세돌 9단이 '구글 매치' 4국에서 알파고에 첫승을 거두자 정보기술(IT) 전문가들은 "이세돌이 알파고를 흔들어 드디어 버그(오류)를 찾아냈다"고 입을 모았다. 알파고는 이 9단이 중앙에서 묘수(백 78)를 작렬하자 허둥지둥 하기 시작하더니 속칭 '떡수(말도 안되는 수)'를 연발했고, 결국 'resigns(불계)'를 선언했다.

그렇다면 이세돌 9단은 어떻게 해서 알파고를 흔들 수 있었을까. IT 전문가들과 별도로 프로 기사들은 이 9단은 3국까지 치르면서 알파고의 약점을 포착했다고 평했다. 효율적인 공략법을 찾았고, 그게 4국에서 주효했다는 뜻이다. 15일 열리는 최종 5국에서도 이 9단은 비슷한 전략을 구사할 것으로 보인다.

이세돌의 필승 전략: 선(先)실리, 후(後)타개

알파고는 1~3국에서 경이로운 계산력으로 이 9단은 물론 바둑 관계자들을 놀라게 했다. 인간의 뇌 역할을 하는 1202개의 중앙처리장치(CPU)를 활용해 '인간 대표'를 압도했다. 알파고에 대해 전혀 정보가 없었던 이세돌 9단은 속수무책이었다. 하지만 투혼의 승부사는 그 과정에서 지피지기(知彼知己)의 지혜를 터득했다.

알파고는 항상 승리 가능성이 높은 수를 선택한다. 이 9단 입장에서는 초반에 조금이라도 우위를 빼앗겼다가는 형세를 뒤집기가 매우 힘들다. 1국이 대표적인 경우였다. 그렇다면 바둑 이론상 가장 효율적인 대처법은 중반까지 실리 위주로 간 뒤 중반 이후 타개(상대방의 진영에 들어가 집을 삭감하는 것) 승부수를 던지는 것이다. 이세돌은 2국에서 바로 선(先) 실리 전략을 구사했다. 하지만 타개에 실패했다.

마침내 4국에서는 이 타개가 먹혔다. 중앙 알파고의 진영을 흔들기 시작하자 알파고도 당황했다. 그것이 첫 승으로 이어졌다. 바둑 TV 해설을 맡은 홍민표 9단은 "'선(先)실리, 후(後)타개'는 이세돌 9단의 바둑 스타일"이라며 "동료 기사들과 함께 연구한 결과, 이 전략으로 승부해야 한다는 결론을 내렸다"고 말했다.


'역(逆) 우주류' 활용

1970~1980년대 일본의 다케미야 마사키 9단은 '우주류(宇宙流)'로 한 시대를 풍미했다. 바둑 역사상 가장 우아하고 낭만적인 기풍으로 꼽히는 우주류는 바둑판의 중앙(네 귀퉁이를 제외한 가운데)을 중시하는 전략이었다. 하지만 안타깝게도 90년대 이후 이 우주류를 구사하는 기사는 거의 없다. 허점이 너무 많아 승률이 떨어지기 때문이다.

이세돌 9단은 4국에서 착실하게 실리를 챙기면서 알파고로 하여금 중앙에 큰 집 모양을 짓게 해줬다. 나중에 타개하기 위해 알파고에게 우주류를 강요한 것이다. 알파고가 큰 모양을 짓자 그 안에 침투해 싸움을 유도했다.

이 9단이 판을 어지럽히자 알파고는 헷갈리기 시작했다. 사실 알파고가 인간(프로 기사)이었다면 이 9단의 묘수(백 78) 이후에도 충분히 이길 수 있었다. 백 대마 전체를 공격할 수도 있었고, 일부는 살려주고 나머지만 공격할 수도 있었고, 아예 실리 전략으로 선회해 귀를 챙기면서 끝내기만 잘 해도 형세는 유리했다. 박정상 9단, 송태곤 9단, 이현욱 8단 등 해설에 나선 프로 기사들도 모두 의아해했다.

구글에 따르면, 알파고는 몬테카를로 방식(무한에 가까운 데이터, 기보 활용)을 바탕으로 정책망(policy network)과 가치망(value network)의 신경망을 활용한다. 그런데 이세돌 9단이 중앙에 침투해 난전을 유도하자 어떤 선택이 더 가치있고, 어떤 정책을 펼쳐야 하는지 혼돈에 빠졌다. 이 9단이 이미 상당히 실리를 확보하고 있었던 것도 알파고의 판단을 흐트러뜨렸다. '선(先)실리, 후(後)타개'가 성공한 순간이었다.

알파고에게도 중앙(中央)은 미지의 영역?

바둑판에서 중앙은 프로 기사들에게 '미지의 영역'으로 불린다. 두 면이 막혀 있는 네 곳의 귀(귀퉁이)와 한 면이 막혀 있는 네 곳의 변에서는 정석(定石)이 가능하다. 인간들도 알파고 못지 않게 웬만한 '경우의 수'를 다 알고 있다는 뜻이다. 하지만 포석이 끝나고 중앙에서 전투가 시작되면 이제 딱히 정석이 없다. 사방이 트여 있는 중앙은 변수가 많아 무엇이 정답인지 알기 힘들다. 여기서 바로 인간은 직관을 발휘한다. 인간이 알파고보다 유리하다고 봤던 근거가 바로 이 직관이었다.

하지만 알파고는 1~3국에서 프로 기사들의 눈을 휘둥그레하게 할만한 놀라운 감각의 수(예컨대 변에서 어깨 짚는 수)를 구사하며 중앙 운영에서도 놀라운 솜씨를 보여줬다. 중앙마저도 고도의 계산력으로 해결하는 면모를 보여줬다.

하지만 이것은 알파고가 우위를 유지하고 있을 때 위력을 발휘한다. 이 균형이 깨어지자 알파고도 흔들렸다. 알파고에게도 변수가 너무 많은 중앙은 모든 경우의 수를 다 파악하기가 어렵다는 뜻으로 보인다. 반대로 인간은 직관의 힘에 좀더 의지해도 될 것 같다. 이세돌 9단의 5국 전략도 여기에 닿아있다.
김형중 기자 telos21@sportschosun.com

:) 당신이 좋아할만한 뉴스