میان-همبستگی

از testwiki
پرش به ناوبری پرش به جستجو

الگو:Correlation and covariance

مقایسه دیداری هم‌گشت، میان-همبستگی، و خودهمبستگی. برای عملیاتی که تابع f را درگیر می‌کنند، و با این فرض که ارتفاع f برابر ۱٫۰ است، مقدار نتیجه در ۵ نقطه متفاوت توسط مناطق حاشور خورده زیر هر نقطه نشان‌داده شده‌است. همچنین تقارن عمودی برای f همان دلیلی است که f*g و fg در این مثال یکسان هستند.

میان-همبستگی الگو:به انگلیسی در پردازش سیگنال، نوعی «اندازه شباهت» برای دو سری، به عنوان تابعی از «جابجایی» یکی نسبت به دیگری است. به میان-همبستگی، ضرب نقطه‌ای کشویی یا ضرب داخلی کشویی هم گفته می‌شود. از این روش معمولاً برای جستجوی یک سیگنال بزرگ برای یافتن یک سیگنال کوچکتر (که به آن ویژگی الگو:به انگلیسی گفته می‌شود) استفاده می‌شود. این روش در بازشناخت الگو، تحلیل ذره منفرد، برش‌نگاری الکترون، متوسط‌گیری، تحلیل رمز و نوروفیزیولوژی کاربردهایی دارد. میان-همبستگی در طبیعت خود شباهت‌هایی با هم‌گشت دو تابع دارد. در خودهمبستگی، که میان-همبستگی یک سیگنال با خودش است، در تأخیر صفر، همیشه یک قله (پیک) وجود دارد، و اندازه آن همان انرژی سیگنال است.

در احتمالات و آمار، اصطلاح میان-همبستگی به همبستگی بین دو موجودیت از بردارهای تصادفی 𝐗 و 𝐘 اشاره دارد، درحالیکه همبستگی برای یک بردار تصادفی 𝐗 همان همبستگی بین موجودیت‌های خود 𝐗 است، که ماتریس همبستگی 𝐗 را تشکیل می‌دهد. اگر هرکدام از 𝐗 و 𝐘 یک متغیر تصادفی نرده‌ای باشد، که این موضوع در سری‌های زمانی مکرر رخ می‌دهد، آنوقت همبستگی نمونه‌های زمانی مختلف 𝐗 را با نام خودهمبستگی 𝐗 می‌شناسیم، و میان-همبستگی 𝐗 با 𝐘 در طول زمان همان میان-همبستگی زمانی است. در احتمالات و آمار، تعریف همبستگی همیشه شامل یک عامل استانداردسازی است به این شیوه که مقادیر همبستگی‌ها باید بین -۱ و +۱ باشد.

اگر X و Y دو متغیر تصادفی مستقل با توابع چگالی احتمال f و g به ترتیب باشند، آنوقت چگالی احتمال تفریق YX به صورت صوری توسط میان-همبستگی fg معرفی می‌شود (در مفهوم پردازش سیگنال)؛ با این حال، از این اصطلاحات در احتمالات و آمار استفاده نمی‌شود. در مقابل، هم‌گشت f*g (معادل میان-همبستگی f(t) و g(t)) برابر تابع چگالی احتمال برای مجموع X+Y است.

میان-همبستگی برای سیگنال‌های قطعی

برای توابع پیوسته f و g، میان-همبستگی به این صورت تعریف می‌شود:[۱][۲][۳]

که معادل است با

(fg)(τ) f(tτ)g(t)dt

که در آن f(t) به مزدوج مختلط f(t) اشاره دارد، و τ همان جابجایی است که به آن تأخیر (lag) هم گفته می‌شود (یک ویژگی در f در زمان t در g در زمان t+τ اتفاق می‌افتد).

اگر f و g هر دو توابعی متناوب پیوسته با دوره تناوب T باشند، انتگرال از تا را می‌توان با انتگرال در هر بازه [t0,t0+T] با طول T جایگزین کرد:

که معادل است با

(fg)(τ) t0t0+Tf(tτ)g(t)dt

به صورت مشابه، برای توابع گسسته، میان-همبستگی به این صورت تعریف می‌شود:[۴][۵]

که معادل است با

(fg)[n] m=f[mn]g[m].

برای توابع گسسته محدود f,gN، میان-همبستگی (دایره‌وار) به این صورت تعریف می‌شود:[۶]

که معادل است با

(fg)[n] m=0N1f[(mn)modN]g[m].

برای توابع گسسته محدود fN, gM، میان-همبستگی هسته‌ای به این صورت تعریف می‌شود:[۷]

که در آن Kg=[k(g,T0(g)),k(g,T1(g)),,k(g,TN1(g))] یک بردار از توابع هسته‌ای k(,):M×M است و Ti():MM یک تبدیل همگر (آفین) است.

بخصوص، Ti() می‌تواند یک تبدیل ترجمه دایره‌ای، تبدیل دورانی، یا تبدیل مقداری یا غیره باشد. میان-همبستگی هسته‌ای دارد میان-همبستگی را از فضای خطی به فضای هسته گسترش می‌دهد. میان-همبستگی معادل ترجمه است، میان-همبستگی هسته‌ای معادل هر تبدیل همگر (آفین) است، که شامل ترجمه، دوران، و مقیاس‌دهی و غیره است.

شرح

به عنوان مثال، دو تابع با مقدار حقیقی f و g را در نظر بگیرید که فقط به اندازه یک انتقال ناشناخته در طول محور x با هم تفاوت دارند. می‌توان از میان-همبستگی استفاده کرد تا این موضوع را یافت که چقدر باید g را در طول محور x انتقال داد تا آن را با f یکسان‌سازی کرد. فرمول به صورت اساسی تابع g را در طول محور x می‌لغزاند، و در این بین انتگرال حاصل‌ضرب آن‌ها را در هر مکان محاسبه می‌کند. دو تابع موقعی تطابق دارند که مقدار (fg) حداکثر شده باشد. این به آن دلیل است که موقعی که قله‌ها (مساحت مثبت) تراز گردند، آن‌ها مشارکت بالایی در انتگرال دارند. به صورت مشابه، موقعی که فرورفتگی‌ها (مناطق منفی) تراز شوند، آن‌ها نیز یک مشارکت مثبت در انتگرال می‌سازند، زیرا حاصل‌ضرب دو عدد منفی، مثبت است.

پویانمایی که به صورت دیداری نشان‌دهنده آن است که چگونه میان-همبستگی محاسبه می‌شود.

با توابع مختلط-مقدار f و g، و گرفتن مزدوج f اطمینان حاصل می‌شود که قله‌های تراز شده (یا فرورفتگی‌های تراز شده) با مولفه‌های موهومی در انتگرال به صورت مثبت مشارکت دارند.

در اقتصادسنجی، گاهی به میان-همبستگی تأخیری میان-خودهمبستگی الگو:به انگلیسی می‌گویند.[۸]الگو:Rp

ویژگی‌ها

الگو:Unordered list

میان-همبستگی برای بردارهای تصادفی

تعریف

برای بردارهای تصادفی 𝐗=(X1,,Xm)T و 𝐘=(Y1,,Yn)T، که هرکدام شامل عناصر تصادفی است که مقدار چمداشتی و واریانس آن‌ها موجود است، ماتریس میان-همبستگی برای 𝐗 و 𝐘 به این صورت تعریف می‌شود[۹]الگو:Rp

و که ابعاد دارد. اگر به صورت مولفه‌وار بخواهیم بنویسیم:

R𝐗𝐘=[E[X1Y1]E[X1Y2]E[X1Yn]E[X2Y1]E[X2Y2]E[X2Yn]E[XmY1]E[XmY2]E[XmYn]]

لازم نیست بردارهای 𝐗 و 𝐘 ابعاد یکسانی داشته باشند، و حتی می‌توانند یک مقدار اسکالر (نرده‌ای) باشند.

مثال

برای مثال، اگر 𝐗=(X1,X2,X3)T و 𝐘=(Y1,Y2)T بردارهای تصادفی باشند، آنوقت R𝐗𝐘 یک ماتریس 3×2 بعدی است که در آن عنصر (i,j)-ام برابر E[XiYj] است.

تعریف برای بردارهای تصادفی مختلط

اگر 𝐙=(Z1,,Zm)T و 𝐖=(W1,,Wn)T بردارهای تصادفی مختلط باشند، که هرکدام شامل متغیرهای تصادفی باشند که مقدار چشمداشتی و واریانس آن‌ها موجود باشد، ماتریس میان-همبستگی برای 𝐙 و 𝐖 به این صورت تعریف می‌شود

R𝐙𝐖 E[𝐙𝐖H]

که در آن H نشان‌دهنده ترانهاد هرمیتین است.

میان-همبستگی برای فرایندهای تصادفی

در تحلیل سری زمانی و آمار، میان-همبستگی برای یک جفت از فرایندهای تصادفی برابر همبستگی بین مقادیر فرایندها در زمان‌های متفاوت، به عنوان یک تابع از دو زمان است. اگر فرض کنیم (Xt,Yt) یک جفت از فرایندهای تصادفی باشد، و t هر نقطه در زمان باشد (t برای فرایندهای زمان-گسسته می‌تواند عدد صحیح باشد یا برای یک فرایند زمان-پیوسته می‌تواند یک عدد حقیقی باشد). آنوقت Xt یک مقدار (یا تحقق) است که توسط یک اجرای معین از فرایند در زمان t ایجاد شده‌است.

تابع میان-همبستگی

فرض کنید که فرایند دارای میانگین‌های μX(t) و μY(t) نیز واریانس‌های σX2(t) و σY2(t) در زمان t برای هر t باشد. آنوقت تعریف میان-همبستگی بین زمان‌های t1 و t2 به این صورت است[۹]الگو:Rp

که در آن E همان عملگر مقدار چشمداشتی است. توجه کنید که این عبارت ممکن است تعریف نشده باشد.

تابع میان-همبستگی

با تفریق میانگین قبل از ضرب، منجر به ایجاد میان-کوواریانس بین زمان‌های t1 و t2 می‌شود:[۹]الگو:Rp

توجه کنید که این عبارت برای همه سری‌های زمانی و فرایندها خوش-تعریف نیست، زیرا میانگین یا واریانس ممکن است موجود نباشد.

تعریف برای فرایندهای تصادفی در مفهوم گسترده مانا

فرض کنید (Xt,Yt) نمایش‌دهنده یک جفت از فرایندهای تصادفی باشد که به صورت متصل مانای با مفهوم گسترده اند. آنوقت تابع میان-کوواریانس و تابع میان-همبستگی به این صورت معین می‌شوند.

تابع میان-همبستگی

یا به صورت معادل

RXY(τ)=E[XtτYt]

تابع میان-کوواریانس

یا به صورت معادل

KXY(τ)=E[(XtτμX)(YtμY)]

که در آن μX و σX برابر میانگین و انحراف معیار برای فرایند (Xt) هستند، که این مقادیر به علت مانا بودن در زمان ثابت اند؛ و به صورت مشابه برای (Yt)، به همان ترتیب. شکست در تجزیه (خطای نحوی): {\displaystyle \operatorname{E}[\]} نشان‌دهنده مقدار چشمداشتی است. این موضوع که میان-همبستگی و میان-کوواریانس از t مستقل‌اند، دقیقاً یک اطلاعات اضافی است (فرای این موضوع که به صورت منفرد با مفهوم گسترده مانا هستند) این موضوع توسط این نیازمندی منتقل می‌شود که (Xt,Yt) دارای ویژگی مانای با مفهوم گسترده متصل است.

میان-همبستگی برای یک جفت از فرایندهای تصادفی متصل با مفهوم گسترده مانا را توسط میانگین‌گیری ضرب نمونه‌های اندازه‌گیری شده از یک فرایند و نمونه‌های اندازه‌گیری شده از دیگری (و انتقال زمانی آن) قابل تخمین است. نمونه‌های موجود در میانگین می‌تواند یک زیرمجموعه دلخواه از از همه نمونه‌های سیگنال باشد (مثلا نمونه‌های موجود در یک پنجره زمانی محدود یا یک زیرنمونه‌گیریالگو:Which از یکی از سیگنال‌ها). برای تعداد بالایی از نمونه‌ها، این میانگین به میان-همبستگی درست همگرا می‌شود.

نرمال‌سازی

این موضوع در بعضی از رشته‌ها (مثل آمار و تحلیل سری زمانی) معمول است که تابع میان-همبستگی را نرمال‌سازی کنند، تا به یک ضریب همبستگی پیرسون وابسته به زمان برسیم. با این حال، در رشته‌های دیگر (مثل مهندسی) از نرمال‌سازی معمولاً صرف‌نظر می‌شود، و اصطلاح‌های «میان-همبستگی» و «میان-کوواریانس» به جای هم به کار می‌روند.

تعریف میان-همبستگی نرمال‌سازی شده برای یک فرایند تصادفی به این صورت است

ρXX(t1,t2)=KXX(t1,t2)σX(t1)σX(t2)=E[(Xt1μt1)(Xt2μt2)]σX(t1)σX(t2).

اگر تابع ρXX خوش-تعریف باشد، باید مقدار آن در بازه [1,1] بیافتد که در آن ۱ نشان‌دهنده همبستگی کامل و -۱ نشان‌دهنده ضد-همبستگی کامل است.

برای فرایندهای تصادفی با مفهوم گسترده مانا، تعریف اینگونه است

ρXY(τ)=KXY(τ)σXσY=E[(XtμX)(Yt+τμY)]σXσY.

نرمال‌سازی مهم است زیرا هم تفسیرکردن خودهمبستگی به صورت یک همبستگی یک اندازه قدرت وابستگی آماری بدون مقیاس فراهم می‌کند، و هم به این دلیل که نرمال‌سازی تأثیراتی روی ویژگی‌های آماری خودهمبستگی تخمین‌زده شده دارد.

ویژگی‌ها

ویژگی تقارن

برای فرایندهای تصادفی با مفهوم گسترده مانای متصل، تابع میان-همبستگی دارای این ویژگی ویژگی تقارن است:[۱۰]الگو:Rp

RXY(t1,t2)=RYX(t2,t1)

به همان ترتیب برای فرایندهای WSS متصل:

RXY(τ)=RYX(τ)

تحلیل تأخیر زمانی

میان-همبستگی‌ها برای تعیین تأخیر زمانی بین دو سیگنال مفید اند، مثل برای تعیین تأخیر زمانی برای انتشار سیگنالهای صوتی در صول یک آرایه میکروفنی.[۱۱][۱۲]الگو:Clarify بعد از محاسبه میان-همبستگی بین دو سیگنال، ماکزیمم (یا مینیمم اگر سیگنال‌ها به صورت منفی همبسته باشند) برای تابع میان-همبستگی، نشان‌دهنده نقطه‌ای در زمان است که سیگنال‌ها به صورت بهینه تراز شده‌اند؛ یعنی تأخیر زمانی بین دو سیگنال توسط آرگومان ماکزیمم، یا arg max برای میان-همبستگی تعیین می‌شود، مثلاً در

τdelay=argmaxt((fg)(t))

اصطلاح‌شناسی در پردازش تصویر

میان-همبستگی صفر-نرمال‌سازی شده (ZNCC)

برای کاربردهای پردازش تصویر، که در آن روشنایی تصویر و الگو می‌توانند به علت نوردهی یا معرض‌قرارگیری تغییر کنند، می‌توان تصاویر را از اول نرمال‌سازی کرد. این موضوع معمولاً در هر گام با تفریق میانگین و تقسیم بر انحراف معیار انجام می‌شود؛ یعنی، میان-همبستگی یک الگو t(x,y) با یک زیرتصویر f(x,y) به این صورت است

1nx,y1σfσt(f(x,y)μf)(t(x,y)μt).

که در آن n برابر تعداد پیکسل‌ها در t(x,y) و f(x,y) است و μf برابر میانگین f و σf برابر انحراف معیار f است.

در اصطلاح آنالیز تابعی، این موضوع را می‌توان به صورت ضرب نقطه‌ای دو بردار نرمال‌سازی شده تصور کرد؛ یعنی اگر،

F(x,y)=f(x,y)μf

و

T(x,y)=t(x,y)μt

آنوقت مجموع بالا برابر است با

FF,TT

که در آن , برابر ضرب داخلی، و برابر نرم L² norm است. کوشی-شوارتز آنوقت این پیامد را دارد که برد ZNCC برابر در بازه [1,1] است.

از این رو اگر f و t ماتریس‌های حقیقی باشند، میان-همبستگی نرمال‌سازی شده شان برابر کسینوس زاویه بین بردارهای واحد F و T است، و از این رو اگر و فقط اگر موقعی 1 است که F برابر T (ضربدر یم مقدار نرده‌ای مثبت) باشد.

همبستگی نرمال‌سازی شده یکی از روش‌های استفاده شده برای تطابق الگو است، این فرایندی است که برای یافتن رخداد یک الگو، یا شیء در داخل یک تصویر استفاده می‌شود. این همچنین یک نسخه دو-بعدی برای ضریب همبستگی ضرب-گشتاوری پیرسون است.

میان-همبستگی نرمال‌شده (NCC)

NCC مشابه ZNCC است با این تنها تفاوت که در آن مقدار میانگین محلی برای شدت‌ها تفریق نمی‌شود:

1nx,y1σfσtf(x,y)t(x,y)

سامانه‌های غیرخطی

برای استفاده از میان-همبستگی برای سامانه‌های غیرخطی باید احتیاط کرد. در شرایط معین، که بستگی به ویژگی‌های ورودی دارد، میان-همبستگی بین ورودی و خروجی یک سامانه با داینامیک غیرخطی برای تاثیرهای غیرخطی معین می‌تواند کاملاً ناپیدا است.[۱۳] این موضوع به این دلیل بروز می‌کند که بعضی از گشتاورهای درجه‌دوم می‌تواند برابر صفر باشد، و این موضوع می‌تواند به صورت غیرصحیح پیشنهاد بدهد که یک «همبستگی» کم (در مفهوم وابستگی آماری) بین دو سیگنال وجود دارد، اما دو سیگنال در واقع به صورت قوی توسط دینامیک غیرخطی مرتبط هستند.

پانویس

الگو:پانویس

منابع

الگو:یادکرد-ویکی

الگو:آمار

  1. Bracewell, R. "Pentagram Notation for Cross Correlation." The Fourier Transform and Its Applications. New York: McGraw-Hill, pp. 46 and 243, 1965.
  2. Papoulis, A. The Fourier Integral and Its Applications. New York: McGraw-Hill, pp.  244–245 and 252-253, 1962.
  3. Weisstein, Eric W. "Cross-Correlation." From MathWorld--A Wolfram Web Resource. http://mathworld.wolfram.com/Cross-Correlation.html
  4. الگو:Cite book
  5. الگو:Cite book
  6. الگو:Cite book
  7. الگو:Cite book
  8. الگو:Cite book
  9. ۹٫۰ ۹٫۱ ۹٫۲ الگو:Cite book
  10. Kun Il Park, Fundamentals of Probability and Stochastic Processes with Applications to Communications, Springer, 2018, 978-3-319-68074-3
  11. الگو:Cite conference
  12. الگو:Cite journal
  13. الگو:Cite book