خودرمزگذار متغیر

از testwiki
نسخهٔ تاریخ ۶ ژانویهٔ ۲۰۲۴، ساعت ۱۸:۵۶ توسط imported>HujiBot (ربات: افزودن رده‌های همسنگ)
(تفاوت) → نسخهٔ قدیمی‌تر | نمایش نسخهٔ فعلی (تفاوت) | نسخهٔ جدیدتر ← (تفاوت)
پرش به ناوبری پرش به جستجو

الگو:ویکی‌سازی الگو:تمیزکاری الگو:یادگیری ماشین در یادگیری ماشینی،خودرمزگذار متغیر الگو:به انگلیسی، یک نوع شبکه عصبی مصنوعی است که متعلق به خانواده‌های روش‌های بیزی متغیر الگو:به انگلیسی و مدل گرافیکی الگو:به انگلیسی است.[۱] خودرمزگذارهای متغیر علی‌رغم شباهت اسمی و ساختاری به خودرمزگذارها تفاوت‌های فراوانی در هدف و فرمول‌بندی ریاضی دارند. هر دو مدل از دو بخش رمزگذار و رمزگشا تشکیل شده‌اند، در هر دو مدل بخش رمزگذار سعی می‌کند داده‌ها را به یک فضای نهفته الگو:به انگلیسی نگاشت کنند که داده‌ها در این فضا توسط متغیر پنهان توصیف می‌شوند. بخش رمزگشا سعی می‌کند داده‌ها را از فضای نهفته به فضای ورودی نگاشت کند از خودرمزگذار عادی برای کاهش ابعاد، کاهش نویز استفاده می‌شود. نحوهٔ عملکرد خودرمزگذار متغیر نیز همانند خودرمزگذار عادی است اما سعی می‌کنیم با استفاده از یک دانش پیشین الگو:به انگلیسی شروطی روی فضای نهفتهٔ تولید شده توسط رمزگذار قرار دهیم تا نقاط نزدیکالگو:به انگلیسی هم در فضا داده‌هایی نزدیک به هم در فضای ورودی تولید کنند. در این روش رمزگذار می‌تواند چندین دادهٔ جدید از هر ورودی تولید کندک که همه از یک توزیع آماری نمونه‌برداری شده‌اند.[۲][۳]

با اینکه این مدل در ابتدا برای یادگیری خودران (خودسازمانده) طراحی شده بود،[۴][۵] به دلیل اثربخشی بالا عملکرد خود را در یادگیری نیمه‌نظارتی و یادگیری با نظارت اثبات کرده‌است.[۶][۷][۸]

معماری

یک خودرمزگذار متغیر از دو شبکهٔ عصبی مصنوعی به نام‌های رمزگذار الگو:به انگلیسی و رمزگشا الگو:به انگلیسی طراحی شده‌است. شبکهٔ اول داده‌ها را به صورت خام می‌گیرد و پارامترهای توصیف کنندهٔ ورودی داده شده را به عنوان خروجی بخش اول تولید می‌کند. رمزگذار بخش دوم این مدل است که یک تابع است. وظیفه‌ی رمزگذار نگاشت داده‌ها از فضای نهان به فضای ورودی است; این کار با استفاده از تخمین پارامتر‌های میانگین و واریانس یک توزیع نویز الگو:به انگلیسی و سپس نمونه‌گرفتن از آن انجام می‌شود.

برای بهینه‌سازی و آموزش این مدل نیاز به تعریف دو عبارت داریم: "خطای بازسازی" و واگرایی کولبک-لیبلر. تابع ضرر الگو:به انگلیسی مشتق‌پذیر نهایی ما ترکیبی از این دو عبارت خواهد بود. واگرایی کولبک-لیبلر سعی در مشابه کردن توزیع پیشین فضای نهان که یک توزیع نرمال چند متغیره با میانگین صفر و ماتریس کوواریانس همانی فرض گرفته می‌شود با توزیع تخمینی‌ای که از بخش رمزنگار مدل ما بدست می‌آید دارد. عبارت خطای بازسازی وظیفه‌ یکسان کردن خروجی مدل با ورودی داده شده را در بردارد.

فرمول‌بندی

طرح کلی یک خودرمزگذار متغیر. مدل یک x را به عتوان ورودی دریافت می‌کند. رمزگذار این ورودی دریافت شده را از فضای مبدا به فضای نهفته نگاشت می‌کند. رمزگشا با دریافت یک ورودی پس از نمونه‌گیری از توزیع فضای نهفته سعی می‌کند خروجی x' را تولید کند که تا حد ممکن نزدیک ورودی x باشد.

از نگاه مدل‌سازی آماری، مدل سعی در بیشینه کردن احتمال دیدن داده‌ x با انتخاب پارامتر‌های یک توزیع آماری pθ(x)=p(x|θ) را دارد. توزیع گفته شده معمولا به دلیل سادگی نمونه‌گیری و بهینه‌کردن در تابع ضرر یک توزیع نرمال N(x|μ,σ) قرار داده می‌شود که توسط میو و سیگما پارامترسازی می‌شود.

زمانی که یک توزیع پیشین بر روی فضای نهفته z فرض می‌شود، محاسبه‌ و بیشینه‌ کردن احتمال رخداد داده منجر به یک انتگرال غیر قابل حل الگو:به انگلیسی می‌شود. می‌توانیم pθ(x) را با استفاده از توزیع حاشیه‌ای pθ(x|z) از طریق رابطه‌ی مقابل دست آوریم

pθ(x)=zpθ(x|z)pθ(z)dz

در مدل ابتدایی خودرمزگذار متغیر،‌ z معمولا به صورت یک بردار در فضای متناهی اعداد حقیقی تعریف می‌شود و pθ(x|z) همانطور که بالاتر نیز به آن اشاره شد یک توزیع نرمال گرفته می‌شود. فرض‌های گفته شده باعث می‌شود pθ(x) ترکیبی از توزیع‌های گاوسی باشد.

متاسفانه محاسبه‌ی pθ(x) بسیار هزینه‌بر و اکثر اوقات غیرممکن است. برای محاسبه‌ی توزیع داده‌ها نیاز است توزیع پسین pθ(z|x) را با استفاده از یک تابع تخمین بزنیم

qϕ(z|x)pθ(z|x)

با ساده‌سازی بالا مشکل بدست آوردن توزیع داده تبدیل به طراحی یک خودرمزگذار متغیر می‌شود به صورتی که توزیع pθ(x|z) توسط رمزگشا محاسبه می‌شود و تخمین توزیع پسین که بالاتر آن را به صورت qϕ(z|x) تعریف کردیم،‌ توسط رمزنگار محاسبه می‌شود.

کاربرد‌ها

نمونه‌ای از تصویر تولید شده‌ی یک گربه توسط مدل‌های تولیدی عمیق
  • تولید تصاویر جدید
    • تولید داده‌های جدید برای دامنه‌های پزشکی که با مشکل کمبود عکس مواجه هستند بسیار کاربردی است.
  • طراحی چهره‌های جدید برای انسان‌ها و حیوانات
    • طراحان بازی‌های کامپیوتری می‌توانند با الگو گرفتن از این تصاویر چهره‌های جدیدی طراحی کنند.
  • ترجمه‌ی عکس به عکس
    • عکاسان می‌توانند با صرفه‌جویی در زمان و هزینه تصاویر گرفته شده‌ی خود را به عنوان مثال از روز به شب تبدیل کنند.
  • پیشبینی ویدئو و طراحی ادامه‌ی آن
  • تبدیل متن به عکس

جستارهای وابسته

الگو:چندستونه

الگو:Div col end

منابع

الگو:پانویس