بلوسام

ماتریسهای بلوسام (BLOSUM) (ماتریس بلوکهای جایگزینی) یک ماتریس جایگزینی است که در هم ترازی توالیهای پروتئینی استفاده میشود. این ماتریسها برای امتیازدهی هم ترازیهای توالیهای پروتئینی که در تکامل از یکدیگر متمایز شدهاند، استفاده میشود و بر مبنای هم ترازی محلی میباشند. ماتریس بلوسام برای اولین بر در مقالهای توسط Henikoff معرفی شد.[۱] آنها پایگاه دادهٔ بلوکها را برای پیدا کردن مناطق حفاظت شده در پروتئینها پیمایش کردند (مناطقی که در هم ترازی دنباله وقفه وجود ندارد) و فرکانسهای آمینو اسیدهای مرتبط و احتمالهای جایگزینی را به دست آوردند. سپس امتیاز لوجیت هر ۲۱۰ جایگزینی ممکن بین ۲۰ پروتئین استاندارد را محاسبه نمودند. برخلاف ماتریسهای PAM که بر پایه مقایسه بین پروتئین نزدیک برونیابی میشود، ماتریسهای بلوسام بر پایهٔ هم ترازیهای مشاهدهشده ساخته شدهاست.
پس زمینهٔ زیستی
دستورالعملهای ژنتیکی هر سلول از یک موجود زنده در DNA آن ذخیره شده است.[۲] در طول حیات سلول، این اطلاعات برای تولید پروتئین یا برای تقسیم سلولی رونویسی میشوند و احتمال آن وجود دارد که این محتویات در حین این فرایندها دستخوش تغییر شوند.[۲][۳] این تغییر به عنوان جهش شناخته شده است. در سطح مولکولی سیستمهای تنظیم کننده ای هستند که بیشتر این جهشها را اصلاح میکنند.[۳][۴]
عملکرد پروتئینها بسیار وابسته به ساختار آنها است.[۵] تغییر یک آمینواسید در پروتئین ممکن است کارآمدی آن را برای انجام وظیفهٔ مربوطه کاهش یا کارکرد آن را تغییر دهد.[۳] تغییرات این چنینی میتوانند یک عملکرد حیاتی در سلول را مختل کنند یا حتی منجر به مرگ سلول شوند.[۶] در مقابل، این تغییر ممکن است به سلول اجازه ادامهٔ فعالیت هرچند متفاوت را بدهدو جهش به فرزندان موجودات زنده منتقل شود. اگر این تغییر باعث ضعف جسمی قابل توجهی نشود این احتمال وجود دارد که جهش در جمعیت باقی بماند. همچنین این امکان وجود دارد که تغییر در عملکرد یک تغییر مفید باشد.
۲۰ اسید آمینه ترجمه شده توسط کد ژنتیکی تا حدود زیادی از نظر خواص فیزیکی و شیمیایی زنجیرههای جانبی آنها متفاوت هستند.[۵] این اسیدهای آمینه میتواند به طبقهبندی به گروههای مشابه با خواص فیزیکوشیمیایی.[۵] جایگزین کردن یک اسید آمینه با یکی دیگر از همان دسته است بیشتر احتمال دارد به یک کوچکتر تأثیر بر ساختار و عملکرد پروتئین از جایگزینی با یک اسید آمینه از ردههای مختلف.
همترازی توالیها یک روش اساسی برای تحقیقات زیستشناسی مدرن است. رایجترین همردیفی توالیهای پروتئین، جستجوی شباهت بین توالیهای مختلف به منظور فهم تفاوت تکاملی توالیهای پروتئینی به منظور پیش بینی وظیفهٔ ژنهای جهش یافته است. ماتریسها در الگوریتمهای محاسبهٔ میزان شباهت توالیها استفاده میشوند[۱]
اصطلاحات
بلوسام: ماتریس جایگزینی بلوکها، یک ماتریس جایگزینی که برای هم ترازی توالیهای پروتئین استفاده میشود.
ماتریسهای امتیازدهی (آمار در مقابل زیستشناسی): برای معنا یافتن ارزیابی هم ترازی توالیها نیاز به ماتریس امتیازدهی یا جدولی است که بیانگر احتمال جایگزینی معنادار جفت آمینواسیدها یا جفت نوکلئوتیدها در یک همترازی است. امتیازها برای هر موقعیت مکانی از همترازی محلی پروتئینها بهدست میآیند.[۷]
دستههای متعددی از ماتریسهای بلوسام با استفاده از پایگاههای داده وابسته به هم ترازیهای متفاوت وجود دارند که با عددهای متفاوت نامگذاری میشوند. ماتریسهای بلوسام با اعداد بزرگتر برای مقایسهٔ توالیهای نزدیک به هم طراحی شدهاند درحالیکه ماتریسهایی با اعداد کوچکتر این عمل را برای توالیهای نسبتاً دور انجام میدهند. به عنوان مثال BLOSUM80 برای هم ترازی توالیهایی با تفاوت کمتر و BLOSUM45 برای هم ترازی توالیهای متفاوت تر استفاده میشود
ماتریسها توسط ادغام کردن همهٔ دنبالههایی که از درصدی که به یک دنباله داده میشود شبیه تر هستند ساخته میشود، و سپس تنها آن دنبالهها را مقایسه میکند. درصد مذکور به نام ماتریس افزوده میشود. برای نمونه BLOSUM۸۰، از ادغام کردن دنبالههایی با یکسانی بیش از ۸۰ درصد تولید میشود.[۱]
ساخت ماتریسهای بلوسام
ماتریسهای بلوسام با استفاده از اعمال روشهای آماری بر بلوکهای آمینواسیدهای مشابه برای بهدست آوردن امتیازهای شباهت بهدست میآیند.
مراحل روشهای آماری:[۸]
حذف توالی
حذف توالیهای با میزان شباهت بیشتر از r%.
دو روش برای حذف توالیها وجود دارد. یا میتوان توالیها را از بلوک مربوطه حذف کرد یا توالیهای مشابه را یافته و با توالیهای جدیدی که میتوانید نمایندهٔ خوشههای مربوطه باشند جایگزین نمود. این عمل برای جلوگیری از بایاس نتیجه به نفع پروتئینهای مشابه صورت میگیرد.
محاسبه فرکانس و احتمال
پایگاه داده ای برای ذخیرهسازی هم ترازی توالیهایی از نواحی با بیشترین حفاظت از خانوادهٔ پروتئینها.
این هم ترازیها برای بهدست آوردن ماتریس بلوسام استفاده میشوند. نواحی حفاظت شده، نواحی ای از آمینواسیدها هستند که تغییر جزئی بین آنها وجود دارد.
نرخ Log Odd
از رابطهٔ زیر بهدست میآید.
که در آن احتمال مشاهده شده و احتمال مورد انتظار است.
BLOSUM ماتریس
میزان شانس شباهت توسط نرخ Log Odd محاسبه شده و ماتریسهای بلوسام از گرد کردن این مقادیر بهدست میآیند.
امتیاز ماتریسهای بلوسام
یک ماتریس امتیازدهی یا جدولی از مقادیر برای ارزیابی اهمیت هم ترازی توالیها مورد نیاز است. به طور کلی وقتی دو توالی نوکلئوتیدی مقایسه می شوند تمامی آنچه در امتیازدهی در نظرگرفته میشود آن است که دو باز در مکانهای متناظر یکسان هستند یا نه. تمامی برابریها و عدم برابریها امتیاز یکسانی دارند.[۹] ولی این قضیه در رابطه با پروتئینها متفاوت است و ماتریسهای جایگزینی برای آمینواسیدها پیچیدهتر هستند و تمامی عواملی که ممکن است فرکانس جایگزینی را تغییر دهد در نظر گرفته میشوند که در نتیجهٔ آن پنالتی نسبتاً زیاد برای همترازیهایی است که احتمال همولوگ بودن آنها پایین است.[۷]
ماتریسهای جایگزینی ای که به صورت عمده استفاده میشوند ماتریسهای بلوسام (BLOSUM)[۱] و ماتریسهای جهش نقطه ای پذیرفته شده (PAM)[۱۰][۱۱] هستند. این دو ماتریس با روشهای متفاوتی محاسبه میشوند.[۷]
امتیازات در بلوسام امتیازات log_odds هستند که در یک همترازی از نسبت درستنمایی دو آمینو اسید که بیولوژیکی ظاهر شدهاند به درستنمایی هر یک از دو آمینو اسیدی که به صورت اتفاقی ظاهر شدهاند، محاسبه میشود. مقدار مثبت، محتمل تر بودن جایگزینی و امتیاز منفی، غیر محتمل بودن جایگزینی را نتیجه میدهد.[۱۲][۱۳]
تساوی زیر برای محاسبه ماتریس BLOSUM استفاده میشود:
در اینجا احتمال جابجا شدن دو آمینو اسید و در دنبالههای مشابه (هومولوگ) و و احتمال رخ دادن آمینو اسید و به صورت تصادفی در دنباله پروتیینها میباشد. به منظور اینکه ماتریس حاوی مقادیر صحیح ساده باشد از فاکتور استفاده میکنیم.
مثال - BLOSUM62
بلوسام۶۲: پروتئینهای با ارتباط متوسط
بلوسام۸۰: پروتئینهای مرتبط تر
بلوسام۴۵: پروتئینهای با ارتباط کمتر
مقالهای در Nature Biotechnology[۱۴] نشان داد کهBLOSUM۶۲ که سالیان سال است به عنوان استاندارد استفاده میشود طبق الگوریتمی که هنیکوف ارائه داده دقیقاً صحیح نیست.[۱] در کمال تعجب، بلوسام اشتباه محاسبه شده، کارایی جستجو را ارتقا میدهد.[۱۴]
برخی از کاربردهای ماتریس بلوسام در بیوانفورماتیک
کاربردهای پژوهشی
امتیازهای بلوسام در پیش بینی و درک انواع ژن سطحی در میان حاملهای ویروس هپاتیت B حامل[۱۵] و اپیتوپهای لنفوسیت تی مورد استفاده قرار گرفته است[۱۶]
استفاده در BLAST
ماتریسهای بلوسام هم چنین به عنوان ماتریس امتیاز دهی در مقایسهٔ توالیهای DNA و توالیهای پروتئین برای ارزیابی کیفیت هم ترازی استفاده میشود. برای این شکل از سیستم امتیازدهی نرمافزارهای گسترده ای من جمله بلاست وجود دارد.[۱۷]
مقایسه PAM و BLOSUM
علاوه بر ماتریسهای BLOSUM ماتریسهای قبلاً توسعه یافته PAM میتوانند استفاده شوند.[۱]
از آنجا که هر دو ماتریس PAM و BLOSUM روشهای متفاوتی برای نمایش اطلاعات امتیازدهی یکسانی هستند میتوان این دو را مقایسه نمود اما به دلیل تفاوت زیاد روش بهدست آوردن این اطلاعات BLOSUM100 با PAM100 یکی نیست.[۱۸]
| PAM | BLOSUM |
|---|---|
| PAM100 | BLOSUM90 |
| PAM120 | BLOSUM80 |
| PAM160 | BLOSUM60 |
| PAM200 | BLOSUM52 |
| PAM250 | BLOSUM45 |
رابطه بین PAM و BLOSUM
| PAM | BLOSUM |
|---|---|
| برای مقایسهٔ توالیهای بسیار مرتبط،
ماتریسهای PAM با اعداد کمتر استفاده میشوند |
برای مقایسهٔ توالیهای بسیار مرتبط،
ماتریسهای BLOSUM با اعداد بزرگتر استفاده میشوند |
| برای مقایسهٔ توالیهای با ارتباط کمتر
ماتریسهای PAM با اعداد بزرگتر استفاده میشوند |
برای مقایسهٔ توالیهای با ارتباط کمتر
ماتریسهای PAM با اعداد کوچکتر استفاده میشوند |
تفاوت بین PAM و BLOSUM
| PAM | BLOSUM |
|---|---|
| بر مبنای هم ترازی گلوبال
توالیهای نزدیک هم است |
بر مبنای هم ترازی محلی است |
| PAM1 ماتریسی است که از مقایسهٔ توالیهایی
بهدست میآید که کمتر از ۱٪ اختلاف دارند. |
BLOSUM62 ماتریسی است که از مقایسهٔ توالیهایی بهدست میآید
که کمتر از ۶۲٪ به هم شبیه هستند |
| سایر ماتریسهای PAM از برون یابی ماتریس PAM1 بهدست آمدهاند. | بر مبنای هم ترازیهای مشاهده شده است
و از توالیهای پروتئین نزدیک برون یابی نشده است. |
| عددهای بزرگتر در نام گذاری این ماتریسها بیانگر فاصلهٔ تکاملی بیشتر است. | عددهای بزرگتر در نام گذاری این ماتریسها بیانگر
میزان شباهت بیشتر در توالیها و در نتیجه فاصلهٔ تکاملی کمتر است.[۱۹] |
جستارهای وابسته
منابع
پیوند به بیرون
- الگو:Cite journal
- بلوک WWW سرور
- سیستم امتیاز دهی برای انفجار در NCBI
- فایلهای داده از BLOSUM در NCBI سرور FTP.
- تعاملی BLOSUM شبکه تجسم الگو:Webarchive
- ↑ ۱٫۰ ۱٫۱ ۱٫۲ ۱٫۳ ۱٫۴ ۱٫۵ الگو:Cite journal
- ↑ ۲٫۰ ۲٫۱ الگو:Cite book
- ↑ ۳٫۰ ۳٫۱ ۳٫۲ الگو:Cite book
- ↑ الگو:Cite book
- ↑ ۵٫۰ ۵٫۱ ۵٫۲ الگو:Cite book
- ↑ الگو:Cite journal
- ↑ ۷٫۰ ۷٫۱ ۷٫۲ الگو:Cite journal
- ↑ الگو:Cite web
- ↑ الگو:Cite web
- ↑ الگو:Cite book
- ↑ الگو:Cite journal
- ↑ الگو:Cite book
- ↑ NIH "Scoring Systems"
- ↑ ۱۴٫۰ ۱۴٫۱ الگو:Cite journal
- ↑ الگو:Cite journal
- ↑ الگو:Cite journal
- ↑ الگو:Cite web
- ↑ الگو:Cite web
- ↑ الگو:Cite web