این پرونده از ویکیانبار است و ممکن است توسط پروژههای دیگر هم استفاده شده باشد.
توضیحات موجود در صفحهٔ توضیحات پرونده در آنجا، در زیر نشان داده شده است.
خلاصه
توضیحعامل-تصمیم گیرنده-و-محیط.jpg
فارسی: یادگیری تقویتی متشکل از دو عنصر اصلی؛ عامل تصمیمگیرنده و محیط است. منظور از محیط، شیءای است که عامل تصمیمگیرنده عملی بر روی آن انجام میدهد (برای مثال، خود بازی در بازی آتاری یک محیط است). عامل تصمیمگیرنده نیز معرف الگوریتم یادگیری تقویتی و یا هر تابع دیگری که اقدامی را بر روی محیط انجام میدهد، میباشد.
برای به اشتراک گذاشتن – برای کپی، توزیع و انتقال اثر
تلفیق کردن – برای انطباق اثر
تحت شرایط زیر:
انتساب – شما باید اعتبار مربوطه را به دست آورید، پیوندی به مجوز ارائه دهید و نشان دهید که آیا تغییرات ایجاد شدهاند یا خیر. شما ممکن است این کار را به هر روش منطقی انجام دهید، اما نه به هر شیوهای که پیشنهاد میکند که مجوزدهنده از شما یا استفادهتان حمایت کند.
انتشار مشابه – اگر این اثر را تلفیق یا تبدیل میکنید، یا بر پایه آن اثری دیگر خلق میکنید، میبایست مشارکتهای خود را تحت مجوز same or compatible license|یکسان یا مشابه با اصل آن توزیع کنید.
Uploaded a work by تیم تحریریه from https://hooshio.com/%DB%8C%D8%A7%D8%AF%DA%AF%DB%8C%D8%B1%DB%8C-%D8%AA%D9%82%D9%88%DB%8C%D8%AA%DB%8C-%DA%86%DB%8C%D8%B3%D8%AA/ with UploadWizard