Đấu trường AI - Reinforcement Learning là cuộc thi đầu tiên dành cho kỹ sư công nghệ người Việt đam mê trí tuệ nhân tạo (AI) và Reinforcement Learning (học tăng cường) do FPT Software tổ chức trên nền tảng lập trình CodeLearn được khởi xướng từ ngày 8/8/2020. Cuộc thi thu hút gần 1.000 thí sinh người Việt chia làm 445 đội đến từ Việt Nam và nhiều quốc gia khác như Nhật Bản, Hàn Quốc, Đức, Mỹ,… đăng ký tham gia.
Trong vòng chung kết với tên gọi "Đảo giấu vàng", 8 đội xuất sắc vượt qua các vòng đấu loại sẽ thi 15 lượt trận theo hình thức đối kháng, mô phỏng hình thức của Esport để tìm ra đội thắng cuộc. Đây là lần đầu tiên Việt Nam có một cuộc thi mô phỏng game dùng thuật toán về AI kết hợp Esport.
Game đào vàng thi trên nền tảng CodeLearn trong "Đấu trường AI".
Trong số các đội bước vào các lượt trận cuối cùng này, có 4 đội tạo ra agent (máy) ảo dựa trên thuật toán Reinforcement Learning, 4 đội còn lại dùng thuật toán khác không thuộc nhánh AI tạo ra “thợ đào vàng” của mình. Kết quả này được các chuyên gia của cuộc thi đánh giá sẽ là cuộc đấu trí giữa người và trí tuệ nhân tạo.
Điểm đặc biệt của thuật toán này là người tham gia phải lập trình để agent có thể tự học và đưa ra quyết định một cách có chiến thuật. Các máy ảo sau đó phải tự nâng cấp "não bộ" để tự thu thập các nước đi, luật chơi và tính toán chiến thuật để vượt qua đối thủ.
"Học tăng cường là lĩnh vực mới mẻ, hấp dẫn không chỉ ở Việt Nam mà còn trên toàn thế giới. Dù còn hạn chế về kiến thức, trong suốt hai tháng qua, nhóm đã dần huấn luyện 'thợ đào vàng' của mình ngày một chuyên nghiệp hơn nhờ những trận đấu với các đội khác và gợi ý từ các chuyên gia", đại diện đội DeepShuttling đến từ Singapore chia sẻ.
Sau gần 2 tháng diễn ra, "Đấu trường AI" đang trở thành sự kiện đấu trí giữa con người với trí tuệ nhân tạo. Các kỹ sư phải lập trình để agent của đội mình có thể tự học và chiến thắng AI của đối thủ. Đây cũng là nguyên lý của thuật toán Reinforcement Learning: Tự học và tích lũy kinh nghiệm. Hành động đúng được máy lưu lại, sai hoặc không mang lại kết quả bị loại bỏ. Hiệu quả của thuật toán đã được chứng minh qua việc AI có thể chiến thắng người thật trong các game khó nhất hiện nay như Dota2, Starcraft II, đến các loại cờ (cờ vây, cờ vua).
Sau vòng đấu bảng, người tham gia phải tiếp tục cập nhật mã lập trình với sự tư vấn của các chuyên gia hàng đầu về AI, như ông Nguyễn Xuân Phong - Viện nghiên cứu Trí tuệ nhân tạo Mila, ông Vũ Hữu Tiệp - Kỹ sư Học máy tại Google.
Ông Nguyễn Xuân Phong, chuyên gia AI quốc tế, cộng tác tại Viện nghiên cứu Trí tuệ nhân tạo Mila nói: "Tôi và Ban tổ chức khá bất ngờ trước chất lượng của các thí sinh trong cuộc thi lần này. Bản thân học tăng cường đã là một thuật toán khó, trong khi bài toán ban tổ chức đặt ra không hề dễ. Các đội đã thi đấu quyết liệt để chứng tỏ trí tuệ và khả năng của mình, tạo nên một vòng bảng hấp dẫn. Nhiều đội chơi bứt phá ấn tượng bằng việc nắm bắt và ứng dụng thuật toán học tăng cường khiến 'Đấu trường AI' thú vị hơn rất nhiều".
Đội chiến thắng cuộc thi Đấu trường AI - Reinforcement Learning sẽ nhận giải thưởng 100 triệu đồng cùng chuyến tham gia workshop về AI trị giá 20 triệu đồng do FPT Software tổ chức. Ngoài ra, ban tổ chức cũng sẽ trao giải "Tài năng" trị giá 20 triệu đồng và giải "Triển vọng" trị giá 10 triệu đồng cho đội thi có 100% thành viên là học sinh hoặc sinh viên.