بلوسام

از testwiki
پرش به ناوبری پرش به جستجو
این BLOSUM62 ماتریس

ماتریس‌های بلوسام (BLOSUM) (ماتریس بلوک‌های جایگزینی) یک ماتریس جایگزینی است که در هم ترازی توالی‌های پروتئینی استفاده می‌شود. این ماتریس‌ها برای امتیازدهی هم ترازی‌های توالی‌های پروتئینی که در تکامل از یکدیگر متمایز شده‌اند، استفاده می‌شود و بر مبنای هم ترازی محلی می‌باشند. ماتریس بلوسام برای اولین بر در مقاله‌ای توسط Henikoff معرفی شد.[۱] آنها پایگاه دادهٔ بلوک‌ها را برای پیدا کردن مناطق حفاظت شده در پروتئین‌ها پیمایش کردند (مناطقی که در هم ترازی دنباله وقفه وجود ندارد) و فرکانس‌های آمینو اسیدهای مرتبط و احتمال‌های جایگزینی را به دست آوردند. سپس امتیاز لوجیت هر ۲۱۰ جایگزینی ممکن بین ۲۰ پروتئین استاندارد را محاسبه نمودند. برخلاف ماتریس‌های PAM که بر پایه مقایسه بین پروتئین نزدیک برون‌یابی می‌شود، ماتریس‌های بلوسام بر پایهٔ هم ترازی‌های مشاهده‌شده ساخته شده‌است.

پس زمینهٔ زیستی

دستورالعمل‌های ژنتیکی هر سلول از یک موجود زنده در DNA آن ذخیره شده است.[۲] در طول حیات سلول، این اطلاعات برای تولید پروتئین یا برای تقسیم سلولی رونویسی می‌شوند و احتمال آن وجود دارد که این محتویات در حین این فرایندها دستخوش تغییر شوند.[۲][۳] این تغییر به عنوان جهش شناخته شده است. در سطح مولکولی سیستم‌های تنظیم کننده ای هستند که بیشتر این جهش‌ها را اصلاح می‌کنند.[۳][۴]

عملکرد پروتئین‌ها بسیار وابسته به ساختار آن‌ها است.[۵] تغییر یک آمینواسید در پروتئین ممکن است کارآمدی آن را برای انجام وظیفهٔ مربوطه کاهش یا کارکرد آن را تغییر دهد.[۳] تغییرات این چنینی می‌توانند یک عملکرد حیاتی در سلول را مختل کنند یا حتی منجر به مرگ سلول شوند.[۶] در مقابل، این تغییر ممکن است به سلول اجازه ادامهٔ فعالیت هرچند متفاوت را بدهدو جهش به فرزندان موجودات زنده منتقل شود. اگر این تغییر باعث ضعف جسمی قابل توجهی نشود این احتمال وجود دارد که جهش در جمعیت باقی بماند. همچنین این امکان وجود دارد که تغییر در عملکرد یک تغییر مفید باشد.

۲۰ اسید آمینه ترجمه شده توسط کد ژنتیکی تا حدود زیادی از نظر خواص فیزیکی و شیمیایی زنجیره‌های جانبی آنها متفاوت هستند.[۵] این اسیدهای آمینه می‌تواند به طبقه‌بندی به گروه‌های مشابه با خواص فیزیکوشیمیایی.[۵] جایگزین کردن یک اسید آمینه با یکی دیگر از همان دسته است بیشتر احتمال دارد به یک کوچکتر تأثیر بر ساختار و عملکرد پروتئین از جایگزینی با یک اسید آمینه از رده‌های مختلف.

همترازی توالی‌ها یک روش اساسی برای تحقیقات زیست‌شناسی مدرن است. رایج‌ترین همردیفی توالی‌های پروتئین، جستجوی شباهت بین توالی‌های مختلف به منظور فهم تفاوت تکاملی توالی‌های پروتئینی به منظور پیش بینی وظیفهٔ ژن‌های جهش یافته است. ماتریس‌ها در الگوریتم‌های محاسبهٔ میزان شباهت توالی‌ها استفاده می‌شوند[۱]

اصطلاحات

بلوسام: ماتریس جایگزینی بلوک‌ها، یک ماتریس جایگزینی که برای هم ترازی توالی‌های پروتئین استفاده می‌شود.

ماتریس‌های امتیازدهی (آمار در مقابل زیست‌شناسی): برای معنا یافتن ارزیابی هم ترازی توالی‌ها نیاز به ماتریس امتیازدهی یا جدولی است که بیانگر احتمال جایگزینی معنادار جفت آمینواسیدها یا جفت نوکلئوتیدها در یک همترازی است. امتیازها برای هر موقعیت مکانی از همترازی محلی پروتئین‌ها به‌دست می‌آیند.[۷]

دسته‌های متعددی از ماتریس‌های بلوسام با استفاده از پایگاه‌های داده وابسته به هم ترازی‌های متفاوت وجود دارند که با عددهای متفاوت نامگذاری می‌شوند. ماتریس‌های بلوسام با اعداد بزرگتر برای مقایسهٔ توالی‌های نزدیک به هم طراحی شده‌اند درحالی‌که ماتریس‌هایی با اعداد کوچکتر این عمل را برای توالی‌های نسبتاً دور انجام می‌دهند. به عنوان مثال BLOSUM80 برای هم ترازی توالی‌هایی با تفاوت کمتر و BLOSUM45 برای هم ترازی توالی‌های متفاوت تر استفاده می‌شود

ماتریس‌ها توسط ادغام کردن همهٔ دنباله‌هایی که از درصدی که به یک دنباله داده می‌شود شبیه تر هستند ساخته می‌شود، و سپس تنها آن دنباله‌ها را مقایسه می‌کند. درصد مذکور به نام ماتریس افزوده می‌شود. برای نمونه BLOSUM۸۰، از ادغام کردن دنباله‌هایی با یکسانی بیش از ۸۰ درصد تولید می‌شود.[۱]

ساخت ماتریس‌های بلوسام

ماتریس‌های بلوسام با استفاده از اعمال روش‌های آماری بر بلوک‌های آمینواسیدهای مشابه برای به‌دست آوردن امتیازهای شباهت به‌دست می‌آیند.

مراحل روش‌های آماری:[۸]

حذف توالی

حذف توالی‌های با میزان شباهت بیشتر از r%.

دو روش برای حذف توالی‌ها وجود دارد. یا می‌توان توالی‌ها را از بلوک مربوطه حذف کرد یا توالی‌های مشابه را یافته و با توالی‌های جدیدی که می‌توانید نمایندهٔ خوشه‌های مربوطه باشند جایگزین نمود. این عمل برای جلوگیری از بایاس نتیجه به نفع پروتئین‌های مشابه صورت می‌گیرد.

محاسبه فرکانس و احتمال

پایگاه داده ای برای ذخیره‌سازی هم ترازی توالی‌هایی از نواحی با بیشترین حفاظت از خانوادهٔ پروتئین‌ها.

این هم ترازی‌ها برای به‌دست آوردن ماتریس بلوسام استفاده می‌شوند. نواحی حفاظت شده، نواحی ای از آمینواسیدها هستند که تغییر جزئی بین آن‌ها وجود دارد.

نرخ Log Odd

از رابطهٔ زیر به‌دست می‌آید.

logOddRatio=2log2(P(O)/P(E))

که در آن P(O) احتمال مشاهده شده و P(E) احتمال مورد انتظار است.

BLOSUM ماتریس

میزان شانس شباهت توسط نرخ Log Odd محاسبه شده و ماتریس‌های بلوسام از گرد کردن این مقادیر به‌دست می‌آیند.

امتیاز ماتریس‌های بلوسام

یک ماتریس امتیازدهی یا جدولی از مقادیر برای ارزیابی اهمیت هم ترازی توالی‌ها مورد نیاز است. به طور کلی وقتی دو توالی نوکلئوتیدی مقایسه می شوند تمامی آنچه در امتیازدهی در نظرگرفته می‌شود آن است که دو باز در مکان‌های متناظر یکسان هستند یا نه. تمامی برابری‌ها و عدم برابری‌ها امتیاز یکسانی دارند.[۹] ولی این قضیه در رابطه با پروتئین‌ها متفاوت است و ماتریس‌های جایگزینی برای آمینواسیدها پیچیده‌تر هستند و تمامی عواملی که ممکن است فرکانس جایگزینی را تغییر دهد در نظر گرفته می‌شوند که در نتیجهٔ آن پنالتی نسبتاً زیاد برای همترازی‌هایی است که احتمال همولوگ بودن آن‌ها پایین است.[۷]

ماتریس‌های جایگزینی ای که به صورت عمده استفاده می‌شوند ماتریس‌های بلوسام (BLOSUM)[۱] و ماتریس‌های جهش نقطه ای پذیرفته شده (PAM)[۱۰][۱۱] هستند. این دو ماتریس با روش‌های متفاوتی محاسبه می‌شوند.[۷]

امتیازات در بلوسام امتیازات log_odds هستند که در یک همترازی از نسبت درست‌نمایی دو آمینو اسید که بیولوژیکی ظاهر شده‌اند به درست‌نمایی هر یک از دو آمینو اسیدی که به صورت اتفاقی ظاهر شده‌اند، محاسبه می‌شود. مقدار مثبت، محتمل تر بودن جایگزینی و امتیاز منفی، غیر محتمل بودن جایگزینی را نتیجه می‌دهد.[۱۲][۱۳]

تساوی زیر برای محاسبه ماتریس BLOSUM استفاده می‌شود:

Sij=(1λ)log(pijqi*qj)

در اینجا pij احتمال جابجا شدن دو آمینو اسید i و j در دنباله‌های مشابه (هومولوگ) و qi و qj احتمال رخ دادن آمینو اسید i و j به صورت تصادفی در دنباله پروتیین‌ها می‌باشد. به منظور اینکه ماتریس حاوی مقادیر صحیح ساده باشد از فاکتور λ استفاده می‌کنیم.

مثال - BLOSUM62

بلوسام۶۲: پروتئین‌های با ارتباط متوسط

بلوسام۸۰: پروتئین‌های مرتبط تر

بلوسام۴۵: پروتئین‌های با ارتباط کمتر

مقاله‌ای در Nature Biotechnology[۱۴] نشان داد کهBLOSUM۶۲ که سالیان سال است به عنوان استاندارد استفاده می‌شود طبق الگوریتمی که هنیکوف ارائه داده دقیقاً صحیح نیست.[۱] در کمال تعجب، بلوسام اشتباه محاسبه شده، کارایی جستجو را ارتقا می‌دهد.[۱۴]

برخی از کاربردهای ماتریس بلوسام در بیوانفورماتیک

کاربردهای پژوهشی

امتیازهای بلوسام در پیش بینی و درک انواع ژن سطحی در میان حامل‌های ویروس هپاتیت B حامل[۱۵] و اپیتوپ‌های لنفوسیت تی مورد استفاده قرار گرفته است[۱۶]

استفاده در BLAST

ماتریس‌های بلوسام هم چنین به عنوان ماتریس امتیاز دهی در مقایسهٔ توالی‌های DNA و توالی‌های پروتئین برای ارزیابی کیفیت هم ترازی استفاده می‌شود. برای این شکل از سیستم امتیازدهی نرم‌افزارهای گسترده ای من جمله بلاست وجود دارد.[۱۷]

مقایسه PAM و BLOSUM

علاوه بر ماتریس‌های BLOSUM ماتریسهای قبلاً توسعه یافته PAM می‌توانند استفاده شوند.[۱]

از آنجا که هر دو ماتریس PAM و BLOSUM روش‌های متفاوتی برای نمایش اطلاعات امتیازدهی یکسانی هستند می‌توان این دو را مقایسه نمود اما به دلیل تفاوت زیاد روش به‌دست آوردن این اطلاعات BLOSUM100 با PAM100 یکی نیست.[۱۸]

PAM BLOSUM
PAM100 BLOSUM90
PAM120 BLOSUM80
PAM160 BLOSUM60
PAM200 BLOSUM52
PAM250 BLOSUM45
رابطه بین PAM و BLOSUM
PAM BLOSUM
برای مقایسهٔ توالی‌های بسیار مرتبط،

ماتریس‌های PAM با اعداد کمتر استفاده می‌شوند

برای مقایسهٔ توالی‌های بسیار مرتبط،

ماتریس‌های BLOSUM با اعداد بزرگتر استفاده می‌شوند

برای مقایسهٔ توالی‌های با ارتباط کمتر

ماتریس‌های PAM با اعداد بزرگتر استفاده می‌شوند

برای مقایسهٔ توالی‌های با ارتباط کمتر

ماتریس‌های PAM با اعداد کوچکتر استفاده می‌شوند

تفاوت بین PAM و BLOSUM
PAM BLOSUM
بر مبنای هم ترازی گلوبال

توالی‌های نزدیک هم است

بر مبنای هم ترازی محلی است
PAM1 ماتریسی است که از مقایسهٔ توالی‌هایی

به‌دست می‌آید که کمتر از ۱٪ اختلاف دارند.

BLOSUM62 ماتریسی است که از مقایسهٔ توالی‌هایی به‌دست می‌آید

که کمتر از ۶۲٪ به هم شبیه هستند

سایر ماتریس‌های PAM از برون یابی ماتریس PAM1 به‌دست آمده‌اند. بر مبنای هم ترازی‌های مشاهده شده است

و از توالی‌های پروتئین نزدیک برون یابی نشده است.

عددهای بزرگتر در نام گذاری این ماتریس‌ها بیانگر فاصلهٔ تکاملی بیشتر است. عددهای بزرگتر در نام گذاری این ماتریس‌ها بیانگر

میزان شباهت بیشتر در توالی‌ها و در نتیجه فاصلهٔ تکاملی کمتر است.[۱۹]

جستارهای وابسته

منابع

الگو:پانویس

پیوند به بیرون