গভীর 'শক্তিবৃদ্ধি শিক্ষা' শিক্ষণ রোবট কখনও নতুন চেয়ে দ্রুত দক্ষতা

$config[ads_kvadrat] not found
Anonim

রোবট স্পিড-আপ ভার্চুয়াল বিশ্বে কাজগুলি কীভাবে সম্পন্ন করতে শিখছে, কয়েক মাস সময় লাগতে পারে এমন ঘন্টার মধ্যে দক্ষতা বিকাশে। সিমুলেটেড গভীর শক্তিবৃদ্ধি শেখার (অথবা ডিপ আরএল) একটি দক্ষতা যা সাধারণত A.I. এর জন্য 55 দিন সময় নেয়। বাস্তব বিশ্বের শিখতে হাইপার অ্যাক্সিলারেটেড ক্লাসরুমে শুধুমাত্র একটি দিন লাগে।

বৃহস্পতিবার লন্ডনে রি-ওয়ার্ক ডিপ লার্নিং সামিটে বলেন, "রোবোটিক্স ডোমেনে আমরা যা করতে পারি তা সত্যিই বিপ্লব করার সম্ভাবনা পেয়েছে"। "আমরা মানব স্তরের দক্ষতা শিখতে পারি।"

এটি কাউন্টার-স্বজ্ঞাত শব্দ হতে পারে, নিশ্চিতভাবে রোবটগুলির পুরো বিন্দু প্রোগ্রামাররা তাদের জিনিসগুলি শেখানোর জন্য ঠিক করতে পারে? যদিও বাস্তব জগতে পরিচালিত একটি মেশিন ডিজাইন করার সময়, কোনও অপরিচিত অবস্থায় কীভাবে কাজ করা যায় তা বোঝার জন্য রোবটদের সম্পূর্ণ তথ্য প্রয়োজন। A.I. এই তথ্যটি যে সমস্ত ঘটনা আগে এসেছে তার উপর ভিত্তি করে একটি দক্ষতা "শিখতে" ব্যবহার করতে পারে।

গভীর শক্তিবৃদ্ধি শিক্ষা তথ্য সংগ্রহ করে যেভাবে মানুষ কীভাবে শিখতে পারে তার অনুরূপ উপায়ে: একটি রোবট বারটি ধরার মতো বারবার একটি কাজ সম্পন্ন করবে এবং একটি নতুন পরিস্থিতিতে বলটি কীভাবে ভালভাবে ধরবে তার একটি চিত্র তৈরির জন্য তথ্য রেকর্ড করবে। ২013 সালে যখন দীপ মিন্ড এটরি গেমস পরিচালনা করবেন তখন একটি রোবট শেখানোর জন্য মডেলটি ব্যবহার করেছিলেন, কেবল পর্দার সামনে বসে বসে এটি শেষ লক্ষ্য বলার মাধ্যমে বৈজ্ঞানিক সম্প্রদায়টি এটি পছন্দ করেছিল।

সমস্যা হয়, এই চিরকাল লাগে। আপনাকে রোবটে বারবার বল ফেলতে হবে, অথবা আটরী ক্ষেত্রে, কিছুক্ষণের জন্য নিজের শোবার ঘরে একা রোবটটি ছেড়ে দেবেন। একটি প্রগতিশীল স্নায়ু নেটওয়ার্কের সাথে মিলিত একটি মুজোকো সিমুলেশন চালানো, প্রশিক্ষকরা রোবটকে অনুকরণ করে, রোবট থেকে শেখানো আচরণগুলি স্থানান্তর করে এবং আসল জগতে ভার্চুয়াল আন্দোলনগুলিকে মানচিত্র করে এমন একটি প্রোগ্রাম চালাতে পারে।

"আমরা সব দিন এবং সারা রাত যারা সিমুলেটর চালাতে পারেন," Hadsell বলেন।

ফলাফলগুলোই নিজেদের ব্যাখ্যা করছে। এই রোবটটি, যিনি ডিপ্লোমা ধরতে পেরেছিলেন, এখন আসল ভার্চুয়াল বল অনুসরণ করতে পারেন, যেমনটি আসলেই বাস্তব ছিল, এটি একটি বড় বল ধরার জন্য যখন এটি বড়দিনের জন্য প্রযোজ্য ছিল:

$config[ads_kvadrat] not found