اخبار

یادگیری بازی‌ها با هوش‌مصنوعی بدون آموزش قبلی

سایت «DeepMind» یک شبکه‌ی هوش‌مصنوعی را طراحی کرده است که قادر به یادگیری بازی‌ها بدون آموزش قوانین آنهاست. این شگفتی جدید که « MuZero» نام دارد، نه تنها از بازی های ساده مثل «شطرنج و Shogi » سر در می‌آورد، بلکه می‌تواند بازی های پیچیده‌ی آتاری را نیز تحلیل کرده و یاد بگیرد.

جولان شبکه های عصبی در یادگیری بازی‌ها

موفقیت هوش مصنوعی قبلی شرکت «DeepMind» حداقل تا حدودی به دلیل هدایت بسیار آسان، چشمگیر بود و همین مسئله، این مجموعه را به فکر ایجاد محصولات جدیدی در این زمینه انداخت؛ بازی « MuZero» که ادامه‌ای برای همین استراتژی است، در واقع یک رقیب فوق‌العاده برای انجام انواع زیادی از بازی هاست. عمده‌ی هوش مصنوعی های قبلی که حتی قهرمانان جهان را نیز در بازی های مختلف شکست می‌دادند، از قوائد و اصول حاکم بر بازی اطلاع داشتند و از قبل، روش بازی برایشان تعریف شده‌بود. از این قبیل، می‌توان به پلت‌فرم هوش مصنوعی «AlphaGo» اشاره کرد که توانست قهرمانان جهان را در بازی«Go» شکست دهد. این شبکه‌ی عصبی، این قوانین را می دانست زیرا روش انجام بازی، از قبل در حافظه اش ثبت شده بود و هنگام بازی کردن با رقبای انسانی، مجموعه‌ای از بهترین شیوه‌ها و استراتژی‌ها را تشکیل داده و عملی می‌کرد. اما « AlphaGo Zero» که نسخه‌ی جدیدتر این شبکه است، به حدی دقیق و شگفت‌انگیز طراحی شده است که همین کار را بدون داده های انسانی انجام می‌دهد؛ آن‌هم فقط با بازی کردن در مقابل خودش! البته ناگفته نماند که نسخه‌ی قبلی توانسته بود همین کار را با بازی های «شطرنج،Go  و Shogi» در سال ۲۰۱۸ انجام دهد و بسیار ماهرانه، در مصاف با آن‌ها پیروز شود!

شاگردی که بدون استاد، یاد می‌گیرد!

شبکه های هوش مصنوعی که برای یادگیری بازی‌ها بدون آموزش قوانین و قوائدشان، براساس قوانینی تغیرناپذیر با دقتی بی‌سابقه طراحی شده‌اند، تا در کمترین زمان ممکن، اصول حاکم بر بازی را شناسایی کرده و مطابق آن‌ها، استراتژی های بازی‌گری خود را بچینند. یک لحظه به این مسئله‌ فکر کنید که اگر در ابتدای بازی شطرنج شما بدانید که یک سرباز می تواند تبدیل به وزیر شود، از همان ابتدا روی این نکته برنامه ریزی می‌کنید، اما اگر مجبور شوید این موضوع را خودتان بفهمید، ممکن است استراتژی های کاملاً متفاوتی را در نظر بگیرید و احتمال باختن شما نیز بسیار بالا خواهد بود. آخرین محصول موفق شرکت «DeepMind» که «MuZero» نام دارد، نه تنها بازی های مذکور بلکه انواع بازی های آتاری را نیز می‌تواند انجام داده و بدون تعریف هیچ دستورالعمل از پیش تعین شده‌ای در رابطه با آن بازی، به مصاف رقیبان برود.  این شبکه‌ی عصبی، طی یک زمان کوتاه هر جنبه‌ای از محیط بازی را در نظر گرفته، مهم بودن یا نبودنش را بسنجد و تاکتیک های پیروزی‌بخش آن را تعریف کرده و عملی سازد.  این روش عملکردی به او کمک می کند تا از اشتباهات خود درس گرفته و بعد از اتمام یک بازی و انجام مجدد آن ، درستی تحلیل ها و سیاست های حاکم بر بازی را به روش آزمون و خطا بسنجد. ارتقاء این شیوه، نه تنها در بازی‌ها، بلکه در جهان واقعی و گستره‌ی علوم مختلف، می تواند منجر به حل مسائلی شود که تاکنون، لاینحل تلقی شده اند.

منبع
techcrunch

نوشته های مشابه

دکمه بازگشت به بالا