کاربرد کنترلکنندههای مبتنی بر هوش مصنوعی در رباتیک نتایج درخشانی را به دنبال داشته است. از بین روشهای مبتنی بر هوش مصنوعی، روشهای یادگیری تقویتی بیشترین سهم استفاده را به خود اختصاص دادهاند. با وجود مزایای وجود پنجه فعال، رباتهای انساننمای بسیار پیشرفته بدون پنجه فعال به کمک یادگیری تقویتی کنترل شدهاند. در این پژوهش دو الگوریتم DDPG و TD3 بر روی ربات انساننمای با پنجه به کار گرفته شده و با یکدیگر مقایسه شدهاند. کارایی چهارچوب طراحی شده در کنترل ربات انساننمای با پنجه، به کمک شبیهسازی سنجیده شده و کنترل ربات با موفقیت انجام شده است.