تابع سیگموئید

از testwiki
نسخهٔ تاریخ ۱۹ فوریهٔ ۲۰۲۵، ساعت ۲۱:۳۵ توسط imported>Lert daree (growthexperiments-addsectionimage-summary-summary: 1)
(تفاوت) → نسخهٔ قدیمی‌تر | نمایش نسخهٔ فعلی (تفاوت) | نسخهٔ جدیدتر ← (تفاوت)
پرش به ناوبری پرش به جستجو
تابع لجستیک

تابع سیگموئید یا سیگماوار الگو:انگلیسی تابعی حقیقی، یکنوا، کران‌دار و مشتق‌پذیر است که به ازای کلیه مقادیر حقیقی قابل تعریف بوده دارای مشتق نامنفی است[۱] که دارای یک نقطه‌ی عطف است. این تابع به لحاظ گرافیکی شکلی شبیه حرف S انگلیسی و سیگما در یونانی دارد و دارای رابطه کلی زیر است:[۱]الگو:وسط‌چین

S(x)=11+ex=exex+1=1S(x).

الگو:پایان وسط‌چیندامنه توابع سیگموئید شامل تمامی اعداد حقیقی بوده و مقدار بازگشتی این تابع نیز به طور یکنواخت از 0 تا 1 یا باتوجه به نوع تابع از 1 تا 1- تغییر می‌کند. طیف گسترده ای از توابع سیگموئید از جمله توابع لجستیک و هذلولی به عنوان تابع فعال‌سازی در شبکه‌های عصبی استفاده می‌شود. منحنی‌های سیگموئید نیز در آمار به عنوان توابع توزیع تجمعی مانند انتگرال‌های چگالی لجستیک، چگالی نرمال و توابع چگالی تی-استیودنت رایج هستند.

خواص

مشتق تابع سیگموئید

تابع سیگموئید لجستیک معکوس‌پذیر است و معکوس آن تابع لوجیت است.

تابع سیگموئید دارای مشتق مرتبه اول است که شکلی مشابه با زنگوله (bell shaped) دارد.

تابع سیگموئید برای مقادیر کمتر از یک نقطه خاص شکلی محدب و برای مقادیر بزرگتر از آن نقطه شکلی مقعر دارد.


تابع سیگموئید دارای دو مجانب افقی است:الگو:وسط‌چین

limx11+ex=0
limx+11+ex=1

الگو:پایان وسط‌چینمشتق این تابع برابر است با:[۲]الگو:وسط‌چین

y=dydx=ex(1+ex)2=y(1y)

الگو:پایان وسط‌چین

نمونه‌هایی از توابع سیگموئید

تابع لجستیک

توابع سیگموئید به چندین شکل و فرم متفاوت وجود دارند و هر یک دارای خصوصیات منحصر به فرد خود می‌باشند. در زیر به برخی از مهمترین انواع توابع سیگموئید پرداخته شده است:

این تابع شاید معروف ترین شکل تابع سیگموئید باشد و به صورت زیر تعریف می شود: الگو:وسط‌چین σ(x)=11+ex الگو:پایان وسط‌چین

تابع tanh

بر خلاف تابع لجستیک، تابع tanh خروجی‌هایی بین -1 و 1 تولید می کند. این تابع به صورت زیر تعریف می شود: الگو:وسط‌چین tanh(x)=exexex+ex الگو:پایان وسط‌چین

تابع arctan

این تابع یک نوع دیگر از تابع سیگموئید است که خروجی‌های بین π/2 و π/2 تولید می‌کند.

تابع Gompertz

تابع Gompertz یک تابع سیگموئید است که معمولاً در مدل سازی سیستم‌هایی که رشد اولیه سریع و در ادامه به کندی رشد می‌کند، مورد استفاده قرار می‌گیرد. فرمول آن به صورت زیر است: الگو:وسط‌چین Gompertz(x)=eex الگو:پایان وسط‌چین

تابع معکوس و اصلاح شده (ISRU و ISRLU)[۳]

این دو تابع اخیراً در حوزه یادگیری عمیق معرفی شده اند. تابع ISRU (Inverted Square Root Unit) و ISRLU (Inverted Square Root Linear Unit) بر اساس تابع سیگموئید هستند و به ترتیب فرمول زیر را دارند: الگو:وسط‌چین ISRU(x)=x1+αx2 الگو:پایان وسط‌چین الگو:وسط‌چین ISRLU(x)=x1+αx2forx<0 الگو:پایان وسط‌چین الگو:وسط‌چین ISRLU(x)=xforx0 الگو:پایان وسط‌چین


کاربردها

منحنی تابع سیگموئید

بسیاری از فرآیندهای طبیعی، مانند منحنی‌های فراگیری سیستم پیچیده، پیشرفتی را از ابتدای آغاز نشان می‌دهند که در طول زمان سرعت می‌گیرد و به اوج خود نزدیک می‌شود. هنگامی که یک مدل ریاضی خاص وجود ندارد، اغلب از یک تابع سیگموئید استفاده می‌شود.[۴]

در شبکه های عصبی مصنوعی، گاهی اوقات از توابع غیرساده برای افزایش بازدهی استفاده می‌شود که این‌ها به عنوان سیگموئیدهای سخت شناخته می شوند.

در پردازش سیگنال صوتی، از توابع سیگموئید به عنوان توابع انتقال شکل موج برای شبیه سازی صدای قطع الکترونیک آنالوگ استفاده می شود.

مشکلات و محدودیت‌ها

هرچند تابع سیگموئید بسیار کاربردی است، اما برخی محدودیت ها و مشکلاتی دارد:

اشباع و کشیدگی گرادیان

وقتی ورودی های تابع سیگموئید خیلی بزرگ یا خیلی کوچک می شود، تابع سیگموئید به سرعت به سمت 1 یا 0 می رود. در این نقاط، مشتق تابع نزدیک به صفر است، به این معنی که تغییرات کوچک در ورودی تقریباً هیچ تأثیری بر خروجی ندارد. این موضوع می تواند به مشکلاتی در یادگیری ماشین منجر شود.

ورودی های منفی

تابع سیگموئید فقط می تواند ورودی های حقیقی را بپذیرد. بنابراین، اگر داده ها ورودی منفی دارند، باید آنها را قبل از استفاده از تابع سیگموئید مقیاس(scale) کنید.


منابع

الگو:ریاضی-خرد