یادگیری بازیها با هوشمصنوعی بدون آموزش قبلی
سایت «DeepMind» یک شبکهی هوشمصنوعی را طراحی کرده است که قادر به یادگیری بازیها بدون آموزش قوانین آنهاست. این شگفتی جدید که « MuZero» نام دارد، نه تنها از بازی های ساده مثل «شطرنج و Shogi » سر در میآورد، بلکه میتواند بازی های پیچیدهی آتاری را نیز تحلیل کرده و یاد بگیرد.
جولان شبکه های عصبی در یادگیری بازیها
موفقیت هوش مصنوعی قبلی شرکت «DeepMind» حداقل تا حدودی به دلیل هدایت بسیار آسان، چشمگیر بود و همین مسئله، این مجموعه را به فکر ایجاد محصولات جدیدی در این زمینه انداخت؛ بازی « MuZero» که ادامهای برای همین استراتژی است، در واقع یک رقیب فوقالعاده برای انجام انواع زیادی از بازی هاست. عمدهی هوش مصنوعی های قبلی که حتی قهرمانان جهان را نیز در بازی های مختلف شکست میدادند، از قوائد و اصول حاکم بر بازی اطلاع داشتند و از قبل، روش بازی برایشان تعریف شدهبود. از این قبیل، میتوان به پلتفرم هوش مصنوعی «AlphaGo» اشاره کرد که توانست قهرمانان جهان را در بازی«Go» شکست دهد. این شبکهی عصبی، این قوانین را می دانست زیرا روش انجام بازی، از قبل در حافظه اش ثبت شده بود و هنگام بازی کردن با رقبای انسانی، مجموعهای از بهترین شیوهها و استراتژیها را تشکیل داده و عملی میکرد. اما « AlphaGo Zero» که نسخهی جدیدتر این شبکه است، به حدی دقیق و شگفتانگیز طراحی شده است که همین کار را بدون داده های انسانی انجام میدهد؛ آنهم فقط با بازی کردن در مقابل خودش! البته ناگفته نماند که نسخهی قبلی توانسته بود همین کار را با بازی های «شطرنج،Go و Shogi» در سال ۲۰۱۸ انجام دهد و بسیار ماهرانه، در مصاف با آنها پیروز شود!
شاگردی که بدون استاد، یاد میگیرد!
شبکه های هوش مصنوعی که برای یادگیری بازیها بدون آموزش قوانین و قوائدشان، براساس قوانینی تغیرناپذیر با دقتی بیسابقه طراحی شدهاند، تا در کمترین زمان ممکن، اصول حاکم بر بازی را شناسایی کرده و مطابق آنها، استراتژی های بازیگری خود را بچینند. یک لحظه به این مسئله فکر کنید که اگر در ابتدای بازی شطرنج شما بدانید که یک سرباز می تواند تبدیل به وزیر شود، از همان ابتدا روی این نکته برنامه ریزی میکنید، اما اگر مجبور شوید این موضوع را خودتان بفهمید، ممکن است استراتژی های کاملاً متفاوتی را در نظر بگیرید و احتمال باختن شما نیز بسیار بالا خواهد بود. آخرین محصول موفق شرکت «DeepMind» که «MuZero» نام دارد، نه تنها بازی های مذکور بلکه انواع بازی های آتاری را نیز میتواند انجام داده و بدون تعریف هیچ دستورالعمل از پیش تعین شدهای در رابطه با آن بازی، به مصاف رقیبان برود. این شبکهی عصبی، طی یک زمان کوتاه هر جنبهای از محیط بازی را در نظر گرفته، مهم بودن یا نبودنش را بسنجد و تاکتیک های پیروزیبخش آن را تعریف کرده و عملی سازد. این روش عملکردی به او کمک می کند تا از اشتباهات خود درس گرفته و بعد از اتمام یک بازی و انجام مجدد آن ، درستی تحلیل ها و سیاست های حاکم بر بازی را به روش آزمون و خطا بسنجد. ارتقاء این شیوه، نه تنها در بازیها، بلکه در جهان واقعی و گسترهی علوم مختلف، می تواند منجر به حل مسائلی شود که تاکنون، لاینحل تلقی شده اند.