AlphaGo, hệ thống trí tuệ nhân tạo đột phá, đã đi vào lịch sử với tư cách là AI đầu tiên đánh bại một kỳ thủ cờ vây chuyên nghiệp và vượt qua một nhà vô địch thế giới.


Được phát triển bởi nhóm nghiên cứu do Demis Hassabis dẫn đầu tại DeepMind – một công ty thuộc Google, AlphaGo được xây dựng dựa trên nền tảng “học sâu” (deep learning).


Cái tên “AlphaGo” là sự kết hợp giữa “Alpha” – chữ cái đầu tiên trong bảng chữ cái Hy Lạp, biểu trưng cho “khởi nguyên” và “dẫn đầu” – và “Go”, tên tiếng Anh của trò chơi cờ vây cổ xưa.


Các thành phần cốt lõi của AlphaGo:


- Move Network (mạng lưới dự đoán nước đi): Dự đoán hoặc lựa chọn nước đi tiếp theo dựa trên vị trí hiện tại trên bàn cờ.


- Fast Moves (nước đi nhanh): Có mục tiêu giống với Move Network nhưng thực hiện nhanh gấp khoảng 1000 lần – đồng nghĩa với việc chất lượng nước đi sẽ giảm tương ứng.


- Estimation Network (mạng lưới đánh giá): Ước lượng khả năng chiến thắng của người chơi trắng hoặc đen dựa trên tình hình hiện tại của ván cờ.


- Monte Carlo Tree Search (thuật toán tìm kiếm cây Monte Carlo): Kết nối ba thành phần trên, tạo nên một hệ thống đồng bộ và toàn diện.


Hệ thống AlphaGo hoàn chỉnh còn bao gồm hai phiên bản cơ bản bổ sung để tối ưu hóa lựa chọn nước đi. Một trong số đó là “Reinforcement Learning Policy Network” – mạng lưới chính sách học tăng cường, được huấn luyện chuyên sâu thông qua hàng triệu ván cờ mô phỏng.


Đây chính là "bộ não nâng cao", không chỉ bắt chước lối chơi của con người mà còn học từ chính các ván đấu mà nó tự tạo ra – từ đó rút ra những nước đi có xác suất dẫn đến chiến thắng cao nhất. Nhóm của Silver đã sử dụng chiến lược thi đấu nội bộ giữa các phiên bản huấn luyện để nâng cao hiệu suất của hệ thống.


Chiến tích lẫy lừng của AlphaGo:


Vào tháng 3 năm 2016, AlphaGo đã bước vào trận đấu lịch sử với kỳ thủ cờ vây số 1 thế giới – Lee Sedol, người mang đẳng cấp chuyên nghiệp cửu đẳng. Kết quả, AlphaGo chiến thắng với tỷ số 4–1, gây chấn động toàn cầu.


Cuối năm 2016 và đầu năm 2017, AlphaGo tiếp tục thắng liền 60 ván không thua trước nhiều cao thủ cờ vây hàng đầu đến từ Trung Quốc, Nhật Bản và Hàn Quốc. Các trận đấu này diễn ra trên một nền tảng cờ trực tuyến Trung Quốc, dưới biệt danh “Master”.


Tại Hội nghị thượng đỉnh cờ vây ở Ngô Châu, Trung Quốc vào tháng 5/2017, AlphaGo đã đánh bại kỳ thủ số 1 thế giới lúc bấy giờ – Ke Jie – với tỷ số tuyệt đối 3–0.


Thành tích này đã khẳng định vị thế AlphaGo như một thực thể vượt qua đỉnh cao của con người trong giới cờ vây chuyên nghiệp.


AlphaGo dừng thi đấu – và AlphaGo Zero ra đời:


Ngày 27 tháng 5 năm 2017, sau khi kết thúc loạt trận với Ke Jie, nhóm phát triển công bố rằng AlphaGo sẽ chính thức rút lui khỏi các giải đấu cờ vây.


Không lâu sau, vào ngày 18 tháng 10 năm 2017, nhóm DeepMind giới thiệu phiên bản mạnh mẽ nhất của AlphaGo, với mật danh AlphaGo Zero – một bước tiến vượt bậc không cần dữ liệu từ con người, mà tự học hoàn toàn từ con số 0.


Con người phản công: chiến thắng đầu tiên trước AI:


Theo một báo cáo gần đây của Financial Times, lĩnh vực nghiên cứu và phát triển AI đang nhận được sự quan tâm trở lại. Đặc biệt, kỳ thủ người Mỹ Kaelin B. Perrin đã làm nên điều không tưởng khi đánh bại hệ thống cờ vây AI hàng đầu – KataGo, vốn được xem là ngang tầm với AlphaGo.


Thành công này đánh dấu một chiến thắng quan trọng của con người trước AI. Perrin đã dành nhiều thời gian nghiên cứu lối chơi của AI, phát hiện ra điểm yếu trong thuật toán và áp dụng kỹ thuật cá nhân để giành phần thắng – cho thấy sự kết hợp tuyệt vời giữa kỹ năng con người và sự hiểu biết chiến lược có thể tạo nên kỳ tích.