شبکه عصبی گراف

از testwiki
پرش به ناوبری پرش به جستجو

الگو:یادگیری ماشین شبکه عصبی گرافی (GNN) یک کلاس از شبکه‌های عصبی مصنوعی برای پردازش داده‌ها است که می‌تواند به صورت یک گراف نمایش داده شود.[۱][۲]

در موضوع کلی‌تر "یادگیری ژرف هندسی"، برخی از معماری‌های شبکه عصبی خاص موجود را می‌توان به عنوان شبکه‌های عصبی گرافی که بر روی گراف‌های خوش‌تعریف عمل می‌کنند تفسیر کرد. شبکه‌های عصبی پیچشی، در زمینه بینایی کامپیوتری، می‌توانند به‌عنوان یک شبکه‌ عصبی گراف به اعمال شده روی گراف‌هایی که به‌صورت شبکه‌هایی از پیکسل‌ها ساخته شده‌اند، دیده شوند. ترنسفورمرها، در زمینه پردازش زبان‌های طبیعی، می‌توانند به‌عنوان شبکه‌های عصبی گرافی دیده شوند که برای گراف کاملی که گره‌های آن‌ها کلمات در یک جمله هستند اعمال می‌شوند.

نکته کلیدی در طراحی شبکه‌های عصبی گرافی، استفاده از روش ارسال پیام به‌صورت زوجی است؛ به‌گونه‌ای که گره‌های گراف به طور مکرر مقادیر و نمایش‌شان را از طریق تبادل اطلاعات با همسایه‌هایشان به‌روز می‌کنند. از زمان ظهور شبکه‌های عصبی گرافی،‌ معماری‌های مختلفی با انواع روش‌های ارسال پیام معرفی شده‌اند. اما تا به امروز این سوال که آیا می‌توان معماری شبکه‌های عصبی گرافی ارائه کرد که از ارسال پیام فراتر برود یا برای هر گرافی که به شکلی مناسب تعریف شده است یک مدل شبکه‌ عصبی گرافی مبتنی بر ارسال پیام طراحی کرد بدون پاسخ باقی‌مانده‌است.

حوزه های کاربرد شبکه‌های عصبی گراف شامل شبکه‌های اجتماعی، شبکه های استنادی، زیست‌شناسی مولکولی، شیمی، فیزیک و مسائل بهینه‌سازی ترکیبیاتی ان‌پی-سخت است.



معماری

در معماری یک شبکه عصبی گرافی عمومی لایه‌های اساسی زیر پیاده‌سازی می‌شوند:

  1. هم‌وردای جایگشتی: یک لایه هم‌وردای جایگشتی، نمایشی از یک گراف را به یک نمایش به‌روز شده از همان گراف نگاشت می‌کند. در مقالات، لایه‌های هم‌وردای جایگشتی از طریق ارسال پیام زوجی بین گره‌های گراف پیاده‌سازی می‌شوند. به طور شهودی، در یک لایه ارسال پیام، گره‌ها با جمع‌آوری پیام‌های دریافتی از همسایگان خود، نمایش خود را به‌روزرسانی می‌کنند. به این ترتیب، هر لایه ارسال پیام، میدان دریافتی شبکه‌ عصبی گرافی را یک جهش افزایش می‌دهد.
    بلوک‌های اصلی ساختار یک شبکه عصبی گراف (GNN). (1) لایه هم‌وردا به جایگشت. (2) لایه ادغام محلی. (3) لایه ادغام سراسری (یا بازخواندن). رنگ‌ها ویژگی‌ها را نشان می‌دهند.
  2. ادغام محلی:‌ یک لایه ادغام محلی، گراف را از طریق نمونه‌کاهی، ناهموار می‌کند.[۳] از ادغام محلی برای افزایش میدان دریافتی یک شبکه عصبی گرافی، به روشی مشابه لایه‌های ادغام در شبکه‌های عصبی پیچشی استفاده می‌شود. به عنوان مثال می‌توان به ادغام k-نزدیک‌ترین همسایه‌ها، ادغام top-k و ادغام توجه‌به‌خود اشاره کرد.[۴]
  3. ادغام سراسری: یک لایه ادغام سراسری، که همچنین به عنوان لایه بازخوانی شناخته می شود، نمایشی با اندازه ثابت از کل گراف ارائه می‌دهد. لایه ادغام سراسری باید نسبت به تغییرات جایگشتی بدون تغییر بماند، به طوری که جایگشت در ترتیب گره‌ها و یال‌های گراف، خروجی نهایی را تغییر ندهد.[۵] مثال‌ها عبارتند از: مجموع، میانگین یا حداکثر عناصر.[۶]

لایه‌های ارسال پیام

به‌روزرسانی نمایش گره‌ها در لایه شبکه عصبی ارسال پیام. گره 𝐱0 پیام ارسال‌شده توسط تمام همسایه‌های مستقیمش یعنی 𝐱1 تا 𝐱4 را دریافت می‌کند. این پیام‌ها توسط تابع پیام ϕ محاسبه می‌شوند که توصیفی از هردوی فرستنده‌ها و گیرنده‌ها است.

لایه‌های انتقال پیام،‌ لایه‌های هم‌وردا نسبت به جایگشت هستند که یک گراف را به نمایش به‌روز شده‌ای از همان گراف نگاشت می‌کنند. در واقع، می‌توان این لایه‌ها را به عنوان شبکه‌های عصبی ارسال‌کننده پیام (MPNN) عنوان کرد.[۷][۸]

فرض کنید G=(V,E) یک گراف با مجموعه گره‌های V و مجموعه یال‌های E و Nu همسایگی گره uV باشد. همچنین فرض کنید 𝐱u بردار ویژگی‌های گره uV و 𝐞uv بردار ویژگی‌های یال (u,v)E باشد. یک شبکه عصبی ارسال‌کننده پیام می‌تواند به شکل زیر بیان شود:

𝐡u=ϕ(𝐱𝐮,vNuψ(𝐱u,𝐱v,𝐞uv))


که ϕ و ψ توابع دیفرانسیل‌پذیر و یک عملگر تجمیع ناوردا نسبت به جایگشت است که می‌تواند تعداد دلخواهی ورودی را بپذیرد. توابع ϕ و ψ اغلب به ترتیب توابع به‌روزرسانی و پیام می‌نامند. به طور شهودی،‌ یک بلوک محاسباتی شبکه عصبی ارسال‌کننده پیام، گره‌های گراف با تجمیع پیام‌های دریافت شده از همسایه‌هایشان،‌نمایش خود را به‌روز می‌کنند.

خروجی های یک یا چند لایه شبکه عصبی ارسال‌کننده پیام، نمایش‌های گره به فرم 𝐡u برای هر گره uV هستند. این نمایش‌های گره می‌توانند برای هر کار جریان پایین‌دست مانند طبقه‌بندی گر‌ه‌ها یا پیش‌بینی یال‌ها به‌کار روند.



لایه‌های ادغام محلی

لایه‌های ادغام محلی گراف را از طریق نمونه‌کاهی ناهموار می‌کنند. ما در اینجا دو استراتژی ادغام محلی قابل یادگیری را ارائه می‌کنیم.[۳] در هر مورد، ورودی یک گراف اولیه است که با ماتریس 𝐗 به عنوان ماتریس ویژگی‌های گره‌ها و ماتریس مجاورت 𝐀 نمایش داده می‌شود. خروجی نیز یک ماتریس ویژگی جدید𝐗 و یک ماتریس مجاورت جدید 𝐀 است.

ادغام Top-k

ابتدا قرار می‌دهیم

𝐲=𝐗𝐩𝐩

که 𝐩 یک بردار پروجکشن قابل یادگیری است. بردار پروجکشن 𝐩 یک مقدار پروجکشن اسکالر برای هر گره محاسبه می‌کند.

لایه ادغام Top-k را می‌توان به شکل زیر بیان کرد:

𝐗=(𝐗sigmoid(𝐲))𝐢
𝐀=𝐀𝐢,𝐢

که 𝐢=topk(𝐲) زیرمجموعه k گره گراف با بالاترین مقدار پروجکشن و نشان‌دهنده ضرب نظیر به نظیر درایه‌های ماتریس است. به عبارت دیگر، گره‌هایی که بالاترین مقادیر پروجکشن را دارند، در ماتریس مجاورت جدید 𝐀 حفظ می‌شوند. تابع سیگموئید استفاده شده نیز باعث می‌شود بردار پروجکشن 𝐩 از طریق پس‌انتشار(backpropagation) قابل یادگیری باشد؛ زیرا در غیر این‌صورت خروجی‌های گسسته تولید می‌شود.[۹]

ادغام توجه به خود

ابتدا قرار می‌دهیم

𝐲=GNN(𝐗,𝐀)

که GNN یک لایه هم‌وردای جایگشتی شبکه عصبی گرافی است.

لایه ادغام توجه به خود را می‌توان به شکل زیر بیان کرد:[۴]

𝐗=(𝐗𝐲)𝐢
𝐀=𝐀𝐢,𝐢

که 𝐢=topk(𝐲) زیرمجموعه k گره گراف با بالاترین مقدار پروجکشن و نشان‌دهنده ضرب نظیر به نظیر درایه‌های ماتریس است.

لایه ادغام توجه به خود را می‌توان به عنوان افزونه‌ای بر لایه ادغام top-k در نظر گرفت. با این تفاوت که مقادیر محاسبه شده در لایه ادغام توجه به خود،‌ توصیفی از هردوی ویژگی‌های گره‌های گراف و توپولوژی آن است.

کاربردها

تاشدگی پروتئین

شبکه‌های عصبی گرافی یکی از اصلی‌ترین بلوک‌های سازنده AlphaFold هستند؛ برنامه هوش مصنوعی طراحی شده توسط تیم دیپ‌مایند شرکت گوگل برای حل مسئله تاشدگی پروتئین در زیست‌شناسی.[۱۰][۱۱]

شبکه‌های اجتماعی

شبکه‌های اجتماعی به دلیل نمایش طبیعیشان به شکل گراف‌های اجتماعی، یک حوزه کاربردی اصلی برای شبکه‌های عصبی گرافی هستند. شبکه‌های عصبی گرافی برای توسعه سامانه‌های توصیه‌گر بر اساس روابط اجتماعی و روابط آیتم‌ها استفاده می‌شوند.[۱۲]

بهینه‌سازی ترکیبیاتی

شبکه‌های عصبی گرافی به عنوان بلوک‌های سازنده اساسی برای چندین الگوریتم بهینه‌سازی ترکیبیاتی استفاده می‌شوند. مثال‌هایی از آن عبارتند از محاسبه کوتاه‌ترین مسیرها یا مدارهای اویلری برای یک گراف، پیدا کردن جایگذاری‌های بهتر تراشه‌ها نسبت به راه‌حل‌های دست انسان، و بهبود قوانین انشعاب طراحی‌شده در شاخه و کران.[۱۳]

همچنین ببینید

منابع