কিভাবে DeepMind একটি eerily আত্মশুদ্ধি বিকাশ এআই। যে মানুষের exsmart করতে পারেন

$config[ads_kvadrat] not found

Dame la cosita aaaa

Dame la cosita aaaa

সুচিপত্র:

Anonim

কম্পিউটার এখন কয়েক দশক ধরে দাবাতে আমাদের ক্ষতিকারক মানুষের গাধা লাঘব করা হয়েছে। 1996 সালে প্রথমবারের মত আইবিএমের ডিপ ব্লু বিশ্ব চ্যাম্পিয়ন গ্যারি ক্যাসপারভকে পরাস্ত করতে সক্ষম হন। কিন্তু বর্ণমালা এর এআই থেকে একটি নতুন গবেষণা। পোশাক Deepipind মাত্র প্রথম বিজয় সত্যিই সুযোগ ছিল সীমিত সীমিত উপর shheds।

একের জন্য, কাসেরভো ডানদিকে ফিরে এসে তিনটি গেম জিতেছিলেন এবং ছয়টি খেলার প্লেঅফে দুবার অঙ্কন করেছিলেন প্রতিদিনের খবর রিপোর্ট।

কিন্তু আরো উল্লেখযোগ্যভাবে, যেমন Deepmind গবেষক জুলিয়ান Schrittwieser বলে বিপরীত, গভীর নীল মত অ্যাপ্লিকেশন এছাড়াও নিজে প্রোগ্রাম করা হয়। এর মানে মানুষকে এআইকে শিক্ষা দিতে হয়েছিল। প্রতিটি কল্পনাপ্রসূত contingency হ্যান্ডেল কিভাবে সম্পর্কে এটি প্রয়োজন। অন্য কথায়, এটি এমনভাবেই ভাল হতে পারে যেহেতু এটি লোকেদের প্রোগ্রামিং করছে। এবং যখন ডিপ নীল স্পষ্টভাবে দাবাতে বেশ ভাল পেতে সক্ষম ছিল; এটা অন্য, অনুরূপ, খেলা মত খেলা দিতে এবং এটি নির্বোধ হয়েছে।

আলফা জিরো সম্পূর্ণ ভিন্ন। একটি নতুন গবেষণা জার্নাল আজ প্রকাশিত বিজ্ঞান লেখক প্রকাশ করেছেন কিভাবে তারা শুধু আলফা জিরোকে দাবাতে মানুষকে হিট করতে শিখতে পারে নি, কিন্তু কিভাবে আলফা জিরোকে শেখান নিজেকে শেখান একাধিক গেম মাস্টার।

কীভাবে শিখবেন এআই। নিজেকে শেখানোর জন্য

আলফা জিরো গভীর শক্তিবৃদ্ধি শেখার নামে একটি কৌশল ব্যবহার করে উন্নত করা হয়েছিল। মূলত, এই এআই শিক্ষাদান জড়িত। দাবা মৌলিক নিয়মগুলির মতো খুব সহজ কিছু, এবং তারপর সেই জটিল জিনিসটি আবার ওভার বার বার কাজ করে না যতক্ষণ না এটি আরো জটিল, কৌশল এবং কৌশলগুলির মতো আকর্ষণীয় বিষয়গুলি শিখায়।

"ঐতিহ্যগতভাবে … মানুষ গেম সম্পর্কে তাদের জ্ঞান নেবে এবং নিয়ম অনুযায়ী এটি কোড করার চেষ্টা করবে," চার বছর ধরে আলফা জিরোতে কাজ করে এমন স্ক্রিটিভিজার বলেছেন। "আমাদের পদ্ধতিটি আমরা এলোমেলোভাবে শুরু করি এবং তারপরে এটি নিজের বিরুদ্ধে গেমগুলি খেলতে দেয় এবং সেই গেমগুলি থেকে এটি কৌশলগুলি কীভাবে কাজ করে তা শিখতে পারে।"

সমস্ত আলফা জিরো মৌলিক নিয়ম পায়, এবং সেখানে থেকে এটি নিজেই বাজানো কিভাবে জয় করে। নতুন পরিসংখ্যান অনুযায়ী, আলফা জিরোকে দাবা মাস্টার্সের জন্য মাত্র 9 ঘন্টা, শোগি মাস্টারের জন্য 1২ ঘন্টা সময় লেগেছিল, এবং 13 বছরের মাস্টার গো এর জন্য এটি ছিল। কারণ এটি নিজেই খেলছে, এটি মূলত স্ব-শিক্ষিত। এটি বিশ্বের সর্বোপরি চ্যাম্পিয়ন মানব পরিচালিত অ্যালগরিদমগুলির মিনিসমেট তৈরি করেছে, ২01২ সালে শোগিতে 2017 বিশ্ব চ্যাম্পিয়নকে পরাজিত করে।

"এটা স্বাধীনভাবে খেলা সম্পর্কে আকর্ষণীয় জ্ঞান আবিষ্কার করতে পারেন," Schrittwieser বলেছেন। "এটি এমন প্রোগ্রামগুলির দিকে পরিচালিত করে যা মানবিক মত আরো খেলা করে।"

যদিও এটির শৈলী মানুষের মতো এবং সৃজনশীল, তবে এটি সম্ভবত সর্বোত্তম, সেটি যথেষ্ট, যাতে যথেষ্ট পরিমাণে আলফা জিরো কোনও গেমটিতে আয়ত্ত করতে সক্ষম হও যাতে এতে সমস্ত উপলব্ধ তথ্য অ্যাক্সেস থাকে। আসলে, আলফা জিরো এত পরিশীলিত, কিভাবে আমরা এআই এর সীমানা ধাক্কা ধরে রাখার জন্য গেমগুলির সম্পূর্ণ ভিন্ন শ্রেণীতে যেতে হতে পারে। সমস্যা সমাধান।

কেন আল্পা জিরো তাই ভাল

A.I. গবেষকরা কয়েকটি কারণে অ্যালগরিদমগুলির চেয়ে আরও অত্যাধুনিক ফর্মগুলির জন্য পরীক্ষার ভিত্তিতে এই গেমটি ব্যবহার করে ভালোবাসেন। তারা মার্জিত, এবং মানুষ শত শত বছর ধরে তাদের জন্য খেলছে, যার অর্থ আপনি আপনার অ্যালগরিদমটি পরীক্ষা করার জন্য সম্ভাব্য চ্যালেঞ্জারদের প্রচুর পেয়েছেন। কিন্তু তারা জটিল এবং জটিলও, যার মানে তারা এটিকে একটি ধাপে পাথর হিসেবে পরিবেশন করতে পারে। যে বাস্তব বিশ্বের সমস্যা সমাধান করতে পারেন। Schrittwieser বলছেন গবেষণা পরবর্তী ক্ষেত্র আলফা জিরো মত একটি অ্যালগরিদম তৈরি করছে যা এখনও অসিদ্ধ তথ্য সঙ্গে সর্বোত্তম সিদ্ধান্ত নিতে পারেন।

তিনি বলেন, "এই সকল গেমসে আপনি যা ঘটছে তা জানেন।" "বাস্তব জগতে, আপনি শুধুমাত্র তথ্যের অংশ জানতে পারেন। আপনি নিজের কার্ডগুলি জানেন তবে আপনি আপনার প্রতিপক্ষের জানেন না, আপনার কাছে আংশিক তথ্য রয়েছে।"

আলফা জিরোর মতো এই অ্যালগরিদমগুলিও এই ধরণের চ্যালেঞ্জ দেওয়ার পক্ষে এখনও সক্ষম রয়েছে - স্ক্রিটিভাইজার স্ট্রেটিগোকে উল্লেখ করেছেন, যার মধ্যে খেলোয়াড়েরা তাদের চলাচলগুলিকে একে অপরের থেকে লুকিয়ে রাখে - এবং স্ট্রাইকক্রাফট, যা ডিপমিনের গেমিং-ফোকাসড গবেষকদের আগ্রহের আরেকটি ক্ষেত্র।

তিনি বলেন, "আমরা যে সমস্যাগুলিকে আরও বেশি জটিল করে তুলতে চাই, সেগুলি তিনি বলেন।" "কিন্তু এটি একটি সময়ে সর্বদা একটি মাত্রা।"

একই সাথে, ডিপ মিন্ডের পরবর্তী প্রজন্মের কম্পিউটারাইজড সমস্যা-সমাধানকারীরা ইতিমধ্যে গেমিং বিশ্বের থেকে বাস্তব জগতে স্থানান্তরের সম্ভাব্যতা প্রদর্শন করছে। এই সপ্তাহের শুরুতে, এটি আলফাফোল্ড নামে আরেকটি অ্যালগরিদম ঘোষণা করেছিল, যা তার 3 ডি কাঠামোর সঠিক পূর্বাভাসে একটি প্রোটিন ক্রমকে এক্সট্র্যাপোল করতে সক্ষম।এটি এমন এক সমস্যা যা কয়েক দশক ধরে বিজ্ঞানীকে ক্ষতিকারক করে তুলেছে এবং আল্জ্হেইমের থেকে সিস্টিক ফাইব্রোসিসের রোগগুলির নিরাময়ের জন্য দরজা খুলে সাহায্য করতে পারে।

$config[ads_kvadrat] not found