- 886
- ۱۴۰۲/۰۲/۰۷ - ۱۰:۳۹
- 214 بازدید
شرح فصل و نکات ویژه: در این فصل به مبحث ترنسکریپتومیکس یعنی آنالیز دادههای بیان ژن پرداخته میشود. از جمله مباحثی که در این فصل بحث میشود شناسایی توالیهای قابل رونویسی میباشد. روشهای سنجش میزان بیان ژنها در این فصل شرح داده میشود. بررسی دادههای بیان ژن در این فصل شرح داده میشود. در رابطه با بهینهسازی کدونی به منظور کلونینگ در این فصل توضیحاتی ارائه میشود. پیشنهاد مطالعاتی: مجموعه ”دروس بیوانفورماتیک” دکتر شریفی زارچی” در سایت[…]
شرح فصل و نکات ویژه:
- در این فصل به مبحث ترنسکریپتومیکس یعنی آنالیز دادههای بیان ژن پرداخته میشود.
- از جمله مباحثی که در این فصل بحث میشود شناسایی توالیهای قابل رونویسی میباشد.
- روشهای سنجش میزان بیان ژنها در این فصل شرح داده میشود.
- بررسی دادههای بیان ژن در این فصل شرح داده میشود.
- در رابطه با بهینهسازی کدونی به منظور کلونینگ در این فصل توضیحاتی ارائه میشود.
پیشنهاد مطالعاتی:
- مجموعه ”دروس بیوانفورماتیک” دکتر شریفی زارچی” در سایت ”مکتبخونه”به آدرس maktabkhooneh.ir منبع بسیار مناسبی برای یادگیری مقدمات زبان برنامهنویسی R و همچنین آنالیز دادههای بیان ژن میباشد.
۲۰۴-فصل نهم
در فصل دوم به شرح سه حوزه ژنومیکس ساختاری، ژنومیکس عملکردی و ژنومیکس مقایسه ای پرداخته شد، ترنسکریپتومیکس یکی از حوزههای ژنومیکس عملکردی به حساب میآید که در این فصل به آن میپردازیم. دو مبحث کلی در رابطه با ژنومیکس عملکردی وجود دارد اول بررسی حضور RNA میباشد و دوم بررسی میزان بیان RNAها میباشد. ترانسکریپتومیکس استفاده از منابع ژنومی به منظور مطالعات عملکردی برای شناسایی و مقایسه ژنهای بیان شونده یک ژنوم تحت شرایط مختلف محیطی، رشدی، بافتی و تکوینی میباشد. ژنومیکس عملکردی بیشتر بر اساس تجربیات آزمایشگاهی است و روی عملکردهای ژنها در سطح کل ژنوم با استفاده از روشهای با توان بالا(High throughput) متمرکز است که بررسی همزمان همهی ژنهای سلول است. بررسی ترانسکریپتوم به درک چگونگی عملکرد مجموعههای ژنی با یکدیگر در ایجاد مسیرهای متابولیکی و تنظیمی و پیام رسانی درون سلول کمک میکند، الگوهای هم بیانی و ژنهای هم تنظیم را آشکار میسازد که این باعث تعیین عملکرد ژنها میشود. در مغز حدود ۱۵۰۰۰ ژن بیان میشوند در حالی که در سلول اپتلیال روده کمتر از ۲۰۰۰ ژن رونویسی میگردند. از ۸۰۰۰ ژنی که در ریشه گیاه مدل آرابیداپسیس بیان میشوند، ۹۰ درصد آنها در ساقه نیز قابل بیان هستند.
از سال ۲۰۰۸ INSDN (همکاری بینالمللی پایگاههای توالیهای نوکلئوتیدی) TSA را بهعنوان پایگاه داده ترنسکریپتوم پذیرفت. TSA که مخفف Transcriptome Shotgun Assembly میباشد از طریق NCBI در دسترست میباشد و دادههای آن شامل ESTها و دادههای NGS میباشد.
تصویر ۱-۹: فرایند رونویسی و اسپلایسینگ.
۱-۹ شناسایی توالیهای ژنهای در حال بیان
روشهای متعددی برای شناسایی ژنهای در حال بیان وجود دارند که در زیر برخی از آنها آورده شده است. و در ادامه این فصل روشهای شناسایی میزان بیان بحث خواهد شد
۱-۱-۹ رونوشتهای پیشبینی شده یا (PT) Predicted transcript
مجموعه توالیهای شناخته شده و پیشبینی شده را رونوشتهای ابراز شده یا ET نامیدهاند. در واقع، ET شامل ژنهای شناسایی شده به روش تجربی و هم ژنهای پیشبینی شده است. PT یا همان ژنهای پیش بینی شده توالیهایی هستند که با استفاده از نرمافزارهای ژنیاب (Gene finder) از روی توالی ژنومی پیش بینی شدهاند.
جدول ۱-۹: ET، EST و TC.
۲-۱-۹ شناسه توالیهای رونویسی شده یا (EST) Expressed sequence tag
از ESTها به وفور به عنوان منبع اطلاعات برای کشف ژنهای جدیدی که عمل آنها به طور تجربی از توالی آنها نتیجه گرفته میشود، استفاده میشود. ESTها مستعد خطا هستند اما کل کتابخانه EST میتواند اطلاعات مفیدی به ما بدهد. با همردیفی ESTها با توالیهای ژنومی اگر همسانی بین ESTها و توالیهای ژنومی پیدا شد، میتوان جایگاه ژنی، ژن رمز کننده و همچنین مرزهای اگزون و اینترونی ژن را پیدا کرد، برای انجام این مراحل میتوان از برنامه SIM4 استفاده کرد.
۲۰۵-ترنسکریپتومیکس
تصویر ۲-۹: مراحل تولید اطلاعات EST.
یکی از بهترین و قابل اعتمادترین راههای شناسایی واحدهای رونویسی، استفاده از روش مشهور به تعیین شناسه توالیهای رونویسی یا EST میباشد. این توالیها کوتاه بوده و از یک یا هر دو انتهای هر همسانه با یکبار توالی یابی مشخص میشوند. در عمل، با استفاده از آغازگرهای مبتنی بر توالی ناقل اقدام به تعیین توالی انتهاهای قطعه درون یک همسانه از کتابخانه cDNA میشود که به طور تصادفی برداشته شده است. در صورتی که توالی دارای حداقل طول ۱۰۰ bp با کمتر از ۳ درصد نوکلئوتید نامشخص (N) باشد، آن توالی در پایگاه GenBAnk یا مشابه آن ذخیره میشود.
پیدا شدن EST یک ژن بستگی به کتابخانه و سلول یا بافت منشاء آن دارد زیرا تحت شرایط محیطی مختلف برنامه بیانی متفاوتی از ژنها در هر سلول اجرا میشود. توالی cDNA درون همسانه به طور کامل تعیین نشده است، بلکه هدف به دست آوردن شناسهای از واحد قابل رونویسی در ژنوم بوده و فقط بخش انتهایی (در یک و گاهی هر دو طرف قطعه cDNA ) تعیین توالی شده است. همسانهها به طور تصادفی و به تعداد چند صد هزار انتخاب میشوند. بنابراین انتظار میرود تعداد EST تکراری بسیار زیادی داشته باشیم.
پایگاههای ذخیره و نمایش اطلاعات ESTها
یکی از اهداف پایگاههای EST، مدیریت و یکپارچه سازی دادههای بزرگ EST تکراری است تا اینکه کیفیت اطلاعات توالی را بهبود بخشند، بنابراین میتوان از دادهها برای استنتاج cDNAهایی با طول کامل بهره برد. برای بهبود اطلاعات از الگوریتمهای مختلفی میتوان استفاده کرد و یکی از نرم افزارهایی که در این زمینه یاریرسان میباشد نرم افزار SIM4 میباشد. به فرایند خوشهبندیی که ESTهای تکراری را کاهش میدهد و مجموعهای از ESTهای شرح نویسی شده و غیر تکرای را تولید میکند، ساخت نمایه ژن (Gene index construction) میگویند.
Unigene پایگاه اطلاعاتی خوشههای EST در NCBI است. (هر خوشه با مجموعهای از توالیهای EST همپوشان است) بعد از حذف توالیهای آلوده (زائد) مثل حاملهای باکتریایی و توالیهای متصل ESTهای تمیز ایجاد میشوند.
۲۰۶-فصل نهم
ESTهای تمیز برای جستوجو توسط BLAST استفاده میشوند. پایگاه Unigene از ترکیب اطلاعات dbEST، پایگاه داده mRNA GeneBank و پایگاه DNA ژنومی که به صورت کامپیوتری پیرایش یافته است ساخته شده است.
TIGR Gene Indices یک پایگاه داده EST است، ولی از روش خوشه بندی متفاوت با UniGene استفاده میکند. این برنامه از ترکیب اطلاعات dbEST،پایگاه داده mRNA GeneBank و پایگاه DNA ژنومی و خود توالیهای پایگاه TIGR استفاده میکند. فقط توالیهایی که در مقایسههای دوتایی، بیش از ۹۵% شباهت را در بیش از چهل نوکلئوتید نشان دادهاند خوشه بندی میشوند. از برنامههای همردیفی برای نشان دادن همپوشانیها استفاده میکنند و توسط برنامههای TIGR Assembler و CAP3 با سر هم کردن توالیهایEST و ET به توالیهای مشترکی دست مییابند که آنها را توالیهای توافق پیشنهادی یا TC (Tentative consensus) نامیدهاند. TC ممکن است دارای توالی کامل و یا ناقص cDNA باشد. جهتگیری توالی از نظر sense یا anti-sense بودن نامشخص است. به همین دلیل، در رکورد مربوط کلیه ORFهای ممکن نشان داده میشوند. برای راحتی کاربران، آماری ازEST و ETهای مورد استفاده در تشکیل یک TC در انتهای رکورد آورده میشود.
تصویر ۳-۹: مراحل تولید اطلاعات TC.
۳-۱-۹ آرایههای مرتب (Tiling Arrays)
آرایههای مرتب یکی از انواع میکرواری میباشد و به جای کاوش برای توالی ژن شناخته شده و یا پیش بینی شده که ممکن است در طول ژنوم پراکنده باشد، آرایههای مرتب به بررسی توالیهای شناخته شده در یک منطقه به هم پیوسته میپردازد. آرایههای مرتب در واقع یک DNA Chip از اولیگومرهای ۲۵ نوکلئوتیدی هستند که از تقسیم توالیهای ژنومی به اولیگونوکلئوئیدهای همپوشان است. هر یک از آنها نسبت به اولیگوی قبلی خود دارای ۱۳ نوکلئوتید مشترک و ۱۲ نوکلئوتید خاص خود است (تصویر ۴-۹).
تصویر ۴-۹: اولیگومرهای Tiling Arrays.
۲۰۷-ترنسکریپتومیکس
DNA chip حاصل در معرض دو رگ سازی به cDNAهای نشاندار مربوط به سلول یا بافت مورد مطالعه قرار میگیرند. به این ترتیب، اولیگوهایی که دارای رونوشتهای بیان شده در سلول مورد نظر هستند شناسایی میشوند. میزان دورگ شدن که شاخصی از بیان ژن است نیز ثبت میشود. با سرهم کردن این توالیهای دورگ شده اولیگونوکلئوتیدی میتوان واحدهای رونویسی با قدرت تمایز ۱۲ نوکلئوتید را به دست آورد. شکل زیر نمونهای از دادههای به دست آمده به این روش را نشان میدهد.
تصویر ۵-۹: مراحل Tiling Arrays.
موسسه Salk در کالیفرنیا دادههای Tiling Arrays بسیاری از موجودات مختلف را جمع آوری نموده و این دادهها را در بانکی به آدرس http://signal.salk.edu در اختیار عموم قرار داده است(تصویر ۶-۹).
۲۰۸-فصل نهم
تصویر ۶-۹: نمونهای از دادههای به دست آمده از بکارگیری روش آرایههای مرتب برای شناسایی واحدهای رونویسی و میزان بیان هر اگزون.
۴-۱-۹ ORFome
ORFome یا full length cDNA project به بررسی کل RNAهای سلول میپردازد. برای مثال پروژه RIKEN به بررسی تمام طول کلون cDNA مربوط به آرابیدوپسیس میپردازد. پروژههای مختلف ORFome تا به حال انجام شده است و یا در حال انجام است که برخی از مهمترین پروژهها را میتوانید در تصویر ۷-۹ ببینید.
تصویر ۷-۹: تعدادی از پروژههای ORFome.
در full length cDNA project ابتدا RNA استخراج میشود و بعد از این که ساخت cDNA از روی RNA انجام شد، توالی cDNA در وکتور کلون میشود و سپس سکئونسینگ انجام میشود که خلاصه مراحل در تصویر ۸-۹ آمده است.
۲۰۹-ترنسکریپتومیکس
تصویر ۸-۹: مراحل full length cDNA project.
یک پایگاه جامع در رابطه با کلونهای cDNA در پستانداران به نام Mammalian Gene Collection (MGC) وجود دارد که تا به حال دادههای مربوط به انسان، موش، رت و گاو را در خود جای داده است و به آدرس http://genecollections.nci.nih.gov/MGC در دسترس عموم میباشد.
تصویر ۹-۹: پایگاه MGC.
۲-۹ سنجش میزان بیان ژنها
اندازه گیری بیان ژن در شرایط، بافت و یا سلولهای مختلف، به فهم و تفسیر ما از فرآیند زیستی و حیاتی کمک زیادی میکند. روشهای مختلفی با قابلیتهای متفاوتی برای سنجش میزان بیان ژنها وجود دارند که در زیر به طور مختصر بیان شدهاند. دادههای حاصل از این روشها در پایگاههای متعددی ذخیره شدهاند.
۲۱۰-فصل نهم
تصویر ۱۰-۹: روشهای سنجش میزان بیان ژنها.
۱-۲-۹ روش لکهگذاری نورترن(Northern blot)
با وجود معرفی روشهای پیشرفته و تولید اطلاعات در مقیاس انبوه، هنوز هم روش نورترن بلات معتبرترین روش برای نشان دادن اندازه رونوشت و میزان بیان آن است. اما انجام این روش مشکل و پرهزینه است. بنابراین اطلاعات کمی با استفاده از این روش به دست آمده است و معمولا در مقالات ثبت شدهاند. در این روش mRNA استخراج شده از سلول با استفاده از روش ژل الکتروفورز جداسازی شده و طی فرآیندی به غشای نایلونی یا نیتروسلولزی منتقل میشود. اساس این روش مشابه روش سادرن بلاتینگ است. با این تفاوت که در آن از کاغذهای فعال شده یا کاغذهای DBM، استفاده میشود. این کاغذها را میتوان به راحتی با تیمارهای شیمیایی خاصی از کاغذ صافی تهیه کرد. در این روش، به علت تک رشتهای بودن RNA و تفکیک آن بر روی ژل واسرشت کننده نیازی به مرحله مجاورت با هیدرکسید سدیم نمیباشد. سپس کاوشگر (Probe) از ژن مورد نظر تهیه و با غشاء مزبور دورگ سازی میشود. پس از شستشوهای پیاپی برای کاهش دورگهای غیراختصاصی، لکههای باقیمانده حاصل از دورگسازی اختصاصی به روشهای مختلفی آشکار سازی میشوند. باند یا باندهای باقی مانده و میزان تیرگی آنها نشاندهنده اندازه رونوشتها و میزان بیان آنها در بافت مورد مطالعه است.
۲-۲-۹ روشRT-PCR کمی (Quantitative RT-PCR)
در اکثر موارد، برای بررسی RNA، یک بررسی کیفی به تنهایی کافی نیست. یک مسئله عمومی که در بررسی بیان ژن مطرح میشود کمیسازی رونوشتهای یک ژن خاص و آشکار سازی تغییر میزان بیان آنها تحت شرایط آزمایشی مختلف است.
real-time RT-PCR امکان کمیسازی دقیق مقادیر شروع کننده از جمله cDNA و RNA هدف را فراهم میسازد. این روش مبتنی بر شناخت cDNA با استفاده از آنزیم reverse transcriptase) RT) و واکنش تکثیری PCR است. از آنجا که تعداد مولکول تکثیر شده به تعداد مولکول الگویی اولیه و بازدهی واکنشهای RT و PCR دارد، روشهای متعددی برای کمی نمودن این روش ابداع شده است که عمدتا بر اساس مقایسه نسبت به ژن دیگر یا نمونه بافتی دیگر هستند. یکی از بهترین روشها در این گروه، روش Real time-PCR است که در آن تعداد مولکول تکثیر شده در حین انجام واکنش بر اساس میزان فلورسانس محاسبه میشود.
میزان فلورسانس در طول هر سیکل اندازه گیری میشود که شدت دینامیک واکنش را افزایش میدهد، زیرا مقدار فلورسانس متناسب با مقدار محصول PCR است. محصولات PCR را میتوان با استفاده از رنگهای فلورسانس که به DNA دو رشته ای متصل میشوند یا با استفاده از پروبهای نشاندار شده با مواد فلورسانس که ویژه توالی هستند قابل سنجش کرد. مرحله RT برای کمیسازی دقیق و صحیح، دارای اهمیت بسیاری میباشد و مقدار cDNA تولید شده باید دقیقاً نمایانگر مقدار RNA ورودی باشد. بنابراین رنج دینامیک، حساسیت و اختصاصی بودن آنزیم، اولین ملاحظاتی هستند که باید برای یک سنجش RT-PCR موفق در نظر گرفته شوند. دادههای این گروه از روشها تا حد زیادی با دادههای حاصل از لکهگذاری نورترن مطابقت میکند، گرچه طیف تغییرات قابل آشکارسازی (Dynamic range ) آن به خوبی لکهگذاری نورترن نیست.
۲۱۱-ترنسکریپتومیکس
تصویر ۱۱-۹: نمودارهای نمایش دهنده شدت بیان ژنها توسط RT-PCR کمی.
۳-۲-۹ اندازهگیری بیان ژن بر اساس تعداد(EST frequency) EST
همان طور که در قسمت قبل آمد، در طی پروژههای EST چند صد هزار نمونهبرداری تصادفی صورت میگیرد. بنابراین تکرار یک EST در طی انجام پروژه با تعداد رونوشت آن ژن ارتباط مستقیم خواهد داشت. با این منطق، در موجوداتی که تعدادEST زیادی تعیین توالی شده است، تعداد EST هر ژن را به عنوان شاخصی از بیان آن ژن میدانند.
۴-۲-۹ روش آرایههای مرتب (Tiling Arrays)
همان طور که در قسمت قبل آمد، این روش اخیرآ معرفی شده است. در این روش میزان دورگ شدن آرایههای مرتب که شاخصی از بیان ژن است به صورت هیستوگرامهای کنار هم ثبت میشود. با سرهم کردن این توالیهای دورگ شده اولیگونوکلئوتیدی میتوان واحدهای رونویسی با قدرت تمایز ۱۲ نوکلئوتید را به دست آورد. در آینده، با تجمع اطلاعات حاصل از بکارگیری این روش امید میرود بتوان میزان بیان هر اگزون را مشاهده نمود.
تصویر ۱۲-۹:سیگنالهای مربوط به Tiling Arrays.
۵-۲-۹ روش تجزیه و تحلیل پیاپی بیان ژنها یا (SAGE)
تکنیک SAGE یا serial analysis of gene expression روش قدرتمندی است که جهت آنالیز بیان ژن درمقیاسهای وسیع بکار گرفته میشود. مجموع اطلاعات SAGE مشتق شده از یک نمونهی سلولی یا بافتی تحت عنوان کتابخانهی SAGE مطرح میشود، که بازتاب فراوانی همه رونوشتها در یک نمونه در زمان مشخص میباشد. برخلاف سایر تکنیکها، روش SAGE به دانش اولیه در مورد توالیهای ژن مورد نظر نیازی ندارد، همچنین امکان آنالیز کمی و کیفی توالی هر رونوشت را در بافت یا سلول مورد نظر فراهم مینماید. این روش بر پایه جداسازی توالیهای tag از mRNA و اتصال این توالیها بصورت سریالی به هم برای فراهم نمودن توالییابی آنها میباشد. SAGE بطور گسترده در پزشکی و زیست شناسی برای آنالیز بیان ژن بکار گرفته میشود. جهت افزایش کارایی این تکنیک در شرایط بخصوص انواع تغییر یافتهای از آن با نام longSAGE، microSAGE، superSAGE و … ایجاد شده است.
۲۱۲-فصل نهم
در سالهای اخیر بویژه با کمک دادهپردازی زیستی این روش بهبود زیادی یافته و در حال رواج مجدد است. ابتدا یک RNA را استخراج کرده و با استفاده از آغازگر پلی T با بیوتین نشاندار شده به cDNA تبدیل میشود. در مرحله بعد با یک آنزیم برشی که جایگاههای زیادی را برش میدهد کار ادامه پیدا میکند و cDNAهای حاصل برش داده میشوند. چون انتهای cDNAها به بیوتین آغشته است و بیوتین میتواند به استرپتواودین متصل شود بنابراین با استفاده از ذرات پوشیده شده با استرپتواودین قطعات مورد نظر جداسازی میشود که قادرند به انتهای برش یافته قطعات بچسبند و در عین حال محل برشی نوع IIS را برای آنزیم کنار هم کننده، دارند (این آنزیم قادر است رشته DNA را ۱۴ جفت باز دورتر از این محل برش دهد). سپس با استفاده از آنزیم برچسبدار کننده قطعات برش داده میشوند. محل برش تا ۱۴ نوکلئوتید جلوتر از محل شناسایی است. آنگاه دو رشته به دست آمده به هم متصل شده
و برچسبهای دوگانه به وجود میآیند. سپس از آغازگرهای ویژه توالیهای اتصال دهنده A و B برای تکثیر آنها استفاده میشود. در مرحله بعد از آنزیم برشی لنگری استفاده شده و برچسبهای دوگانه جداسازی میشوند سپس برچسبهای دوگانه را به هم وصل کرده و آن را همسانهسازی و تعیین توالی میکنند. مشابه تجزیه و تحلیل دادههای میکرواری دادههای SAGE را میتوان تجزیه و تحلیل کرد.
SAGEMP ¬ ابزار جستوجو برای قطعات SAGE.
SAGEX Profiler ¬ دو کتابخانه را با هم مقایسه میکند درباره ژنهای خاموش شده و بیان شده.
SAGE Gene ¬ جور کردن قطعات SAGE حاصل از آزمایشها را با ژنهای شناخته شده ممکن میسازد.
۶-۲-۹ روش سکوئنسینگ NGS
توالی یابی RNA که به توالی یابی شاتگانی کل ترانسکریپتوم[۱] نیز معروف است تکنولوژی ای است که با بهرهگیری از تواناییهای توالی یابی تکنولوژی next-generation sequencing برای بدست آوردن تصویری کلی از حضور و مقدار RNA از ژنوم در یک بازه زمانی خاص استفاده میکند. پیشرفتهای اخیر در NGS باعث شده که بازه پوشش توالی یابی نوکلئوتیدهایDNA و همچنین مقدار نمونه ورودی برای توالی یابی افزایش پیدا کند. این پیشرفتها توالی یابی رونوشتهای RNA سلول را تسهیل میکند و به ما این امکان را میدهد که رونوشتهای برش خورده[۲] ژن، تغییرات پس از رونویسی، همجوشی ژنها[۳]، جهشها و پلی مورفیسم تک نوکلئوتیدی[۴] و در نهایت تغییرات در بیان ژن را بررسی کنیم. دادههای مربوط به دادهای بیان ژن با تکنیک NGS نیز در پایگاه GEO یافت میشود.
[۱] Whole Transcriptome Shotgun Sequencing (WTSS)
[۲] Spliced
[۳] gene fusion
[۴] single-nucleotide polymorphism
۲۱۳-ترنسکریپتومیکس
تصویر ۱۴-۹: روند انجام توالی یابی RNA.
۷-۲-۹ روش ریزآرایه (Microarray)
یکی از مراحل مهم تنظیم بیان ژن در مرحله ساخت mRNA از روی DNA و یا همان رونویسی است، از این رو تخمین میزان کمی mRNA در سلول بسیار اهمیت دارد. برای این منظور فناوریهای زیادی پا به عرصه ظهور گذاشت که یکی از مهمترین آنها فناوری میکرواری[۱] میباشد که انقلابی در عرصه زیستشناسی مولکولی ایجاد نمود. به طور ساده میکرواری عبارت است از فناوری بررسی فعالیت هزاران ژن و یا پروتئین در یک سطح کوچک مانند یک لام. تشخیص تفاوت بیان ژنها در خلال شرایط آزمایشگاهی، بیولوژیکی و کلینیکی به عنوان یکی از موضوعات اصلی در آزمایشهای میکرواری میباشد. علاوه بر این، فناوری میکرواری میتواند در جهت امور دیگر مانند مقایسه ژنوم سالم با بیمار و تشخیص سندرومهای ژنتیکی و تشخیص تعداد زیادی از عوامل پاتوژن در روی یک چیپ میکرواری مورد استفاده قرار گیرد.
جدول ۲-۹: دسته بندی انواع میکرواری.
تکنولوژی میکرواری را میتوان به دو بخش کلی تقسیم نمود، بخش اول مراحل آزمایشگاهی این تکنیک میباشد که شامل: ساخت چیپ میکرواری، استخراج mRNA و ساخت cDNA از روی آن و همزمان نشان دار کردن آن با یک رنگ فلورسانس، مراحل هیبریداسیون، شستشو و خشک کردن چیپ و در نهایت اسکن کردن چیپ میکرواری میباشد. بخش دوم شامل آنالیز دادههای حاصل از آزمایش به کمک نرم افزارها و بانکهای اطلاعاتی موجود میباشد. این دو بخش، لازم و ملزوم یکدیگر بوده و باید سعی شود که به درستی انجام شود چرا که در غیر این صورت نتیجه مناسبی از آزمایش حاصل نخواهد شد. با توجه به متنوع بودن فرمتها و انواع مختلف چیپهای میکرواری، در بخش آنالیز دادههای میکرواری الگوریتمها و تکنیکهای آنالیزی زیادی ارائه شده است.
ریزآرایه یکی از پر کاربردترین روشهای تولید اطلاعات انبوه (High throughput) مربوط به میزان بیان ژن در پروژهای عملکرد ژنومها بوده است. اساس این روش همان دورگسازی DNA بر روی پایه جامد (غشاء یا لام میکروسکوپی) میباشد. به این ترتیب که ابتدا DNA ژنهای مورد نظر را با استفاده از روبات در مقیاس میکرونی روی لام لکهگذاری میکنند. DNA معمولا cDNAهای تکثیر شده توسط PCR است.
[۱] gene fusion
[۱] single-nucleotide polymorphism
[۱] Microarray technology
۲۱۴-فصل نهم
تصویر ۱۵-۹: نمایی از مراحل انجام میکرواری.
در مرحله بعد cDNAهای نشاندار بر مبنای mRNA استخراج شده از بافتهای مورد مطالعه با استفاده از مواد فلوروسانت تهیه میشود. پس از دورگ سازی مولکولهای نشاندار با آرایهها چندین مرتبه شستشو انجام میشود و سپس میزان درخشش لکههای متصل به مولکولهای نشاندار اختصاصی توسط یک اسکنر دقیق ثبت میشود. سپس میزان روشنی هر لکه توسط نرمافزار محاسبه میشود. تجزیه وتحلیل آماری بعدی نشان خواهد داد میزان بیان هر ژن در مقایسه با سایر ژنها و در مقایسه با نمونهی بافتی دیگر چقدر تغییر کرده است. لازم به ذکر است برخلاف میکرواریهایی که برای بررسی میزان بیان ژنها بهکار میروند در تکنیک CGH array هدف بررسی تغییرات ژنومی (حذف و اضافه شدگی جزئی یا کامل کروموزمها) نسبت به ژنوم رفرنس میباشد که امروزه در بررسیهای سیتوژنتیک بسیار پرکاربرد شده است. از نقاط قوت CGH array نسبت با روشهای قدیمی سیتوژنتیک تفکیک بیشتر و از نقاط ضعف آن ناتوانی در شناسایی جابهجاییهای متعادل در کروموزومها میباشد.
در آزمایشگاههای PGD (تشخیص ژنتیکی پیش از لانهگزینی) که فقط یک یا دو سلول از جنین سه تا پنج روزه به منظور بررسی سلامت ژنتیکی در اختیار دارند بهترین روش CGH array میباشد زیرا همچون کاریوتایپ نیاز به کشت سلول ندارد و میتوان در طی دو روز با میزان DNA کم آزمایش را انجام داد و جنین ۵ یا ۶ روزه را در صورت صحت سلامت ژنتیکی به مادر انتقال داد. اندیکاسیون اصلی انجام این تست برای افراد دارای سقط مکرر و یا دارای سابقه چند بار انجام روشهای کمک باروری ناموفق میباشند. از دیگر استفادههای این تست میتوان به آزمایش روی سلولهای بهدست آمده از جنین سقط شده یا هر منبع دیگر از سلولهای زنده و غیر زنده اشاره کرد.
با توجه به حجم انبوه دادههای میکرو اری در پایگاههای تحت وب، بسیاری از پژوهشگران علاقه مندند تا به آنالیز این دادهها بپردازند. در مرحله اول با ورود به آدرس www.ncbi.nlm.nih.gov/geo/ و با جستوجوی شماره مطالعه که معمولا در مقالات ثبت میشود و یا جستوجوی متنی در بانک GEO میتوان فایل خام دادههای میکرواری مربوط به یک مطالعه را دانلود کرد. فرمت فایلهای حاوی دادههای خام میکرواری “.CELL” میباشد. در پوشهای که دانلود میشود چند فایل وجود دارد که مربوط به دادههای کنترل و بیمار میباشند که پژوهشگر باید اطلاعات آزمایش را که در پایگاه GEO وجود دارد را مطالعه کند تا بتواند به صورت صحیح دادهها را مورد بررسی قرار دهد.
نرم افزار EXPRESSION CONSOLE برای نرمال کردن دادهها به کار میرود و توسط این نرم افزار فایلهای الصاقیLibrary و annotation را دانلود میکنیم و با فایل اصلی همراه میکنیم. بعد از یک آنالیز اولیه و نرمال کردن دادهها تمام اطلاعات را با یکدیگر ادغام میکنیم و خروجی TXT از نرم افزار میگیریم. برای ادامه آنالیزها میتوانید از نرم افزار Flexarray mcgill استفاده کنید. فایلی که توسط نرم افزار قبلی ساختیم را میتوانیم در این نرم افزار اجرا کنیم. در این مرحله نرم افزار مشخصات آزمایش را از ما میخواهد که باید مشخص کنیم چه دادههایی مربوط به کنترلها و چه دادهایی مربوط به بیماران بودهاند. با استفاده از این نرم افزار میتوان آنالیزهای آماری متنوعی را انجام داد. علاوه بر نرمافزارهایی که توضیح داده شد یک نرم افزار غیر رایگان به نام CLC Genomics وجود دارد که تمام کارهای مربوط به آنالیز را انجام میدهد. خوشبختانه ابزارهای آنلاین زیادی برای آنالیز دادههای بیان ژن وجود دارند که از طریق اینترنت قابل دسترس میباشند.
۲۱۵-ترنسکریپتومیکس
۹ معرفی وبسایت Enrichr
در بسیاری از مطالعات ترنسکریپتومیکس محقق به تعدادی mRNA بر میخورد که بیان بالا و یا پایینی در سلول مورد نظر، در شرایطی خاص داشتهاند. در ادامه کار محقق میتواند مطالعات بیشتری را بر روی این دسته ژن ادامه دهد تا اطلاعاتی در رابطه با عملکرد این دسته از ژنها پیدا کند مثلا میتواند از ابزارهای رسم شبکه بر اساس GO و یا فاکتورهای دیگر استفاده کند و یا میتواند از پایگاههایی مثل Enrichr به آدرس http://amp.pharm.mssm.edu/Enrichr استفاده کند تا این پایگاه با دریافت یک دسته نام ژن از کاربر و جستوجوی آنها در پایگاههای مختلف عملکرد آن دسته از ژنها را در فرایندهای مختلف زیستی مشخص کند. پژوهشگرانی که بر روی میزان بیان ژنها در شرایط مختلف با استفاده از روشهای مختلف از جمله میکرواری کار میکنند در نتایج خود دسته ای از ژنها را به عنوان ژنهایی که تحت شرایط خاص بیان آنها کمتر و یا بیشتر شدهاند را معرفی میکنند که میتوانند توسط ابزارهایی همچون Enrichr به آنالیز بیشتر دادههای خود بپردازند.
Enrichr ورودی را که یک دسته نام ژن میباشد را در دسته بندیهای مختلف بررسی میکند، دسته بندیهای این پایگاه شامل Pathways، Ontologies، Disease/Drugs، Cell Types و Transcription میباشد. هر دسته بندی شامل چندین پایگاه میباشد که Enrichr ورودی را با بانک هر پایگاه میسنجد و محتملترین موارد را اعلام میکند. در تصویر ۱۶-۹ در دستهبندی Pathways نتایج پایگاه KEGG را مشاهده میکنید که نشان میدهد تعداد قابل توجهی از ژنهایی که در مطالعه ما بیان بالایی داشته اند مربوط به مسیر cytokine cytokine receptor interaction میباشند.
۴-۹ معرفی وبسایت coxpresdb
وبسایت coxpresdb وبسایتی بسیار مفید به منظور پیدا کردن ژنهایی است که با ژن مورد مطالعه شما بیان بالا و یا پایینی خواهند داشت. این وبسایت شامل دادههای میکرو اری پایگاه GEO میباشد و مورد جستوجوی شما را در تمام نمونههای موجود در این پایگاه جستوجو میکند. دسترسی به این پایگاه توسط آدرس coxpresdb.jp قابل دسترس است. شما میتوانید با وارد کردن نام ژن مورد نظرتان در جعبه جستوجو و کلیک بر روی گزینه جستوجو صفحه نتایج را مشاهده کنید. در صفحه نتایج نام موجودات مختلف به تفکیک و جدولهایی در زیر آنها قرار میگیرد که میتوانید بر روی Coexpressed gene list کلیک کنید و ژنهایی که با ژن شما بیان بالا و یا پایینی دارند را مشاهده کنید.
۵-۹ GEO (The Gene Expression Omnibus)
یکی از بهترین مکانهای ذخیره مجموعه دادههای ابراز ژن GEO است که در مرکز اطلاعاتی NCBI قرار دارد. در این پایگاه اطلاعات بیان ژنها با استفاده از روش ریزآرایه و سایر روشهای بررسی که توسط آزمایشگاههای مختلفی تولید شده است ذخیره شده و در دسترس عموم قرار میگیرد. دادههای ریز آرایه موجود شامل دادههای خام و پردازش شده است. برای استفاده از این دادهها نرم افزارها و سخت افزارهای متعددی طراحی شده است. دادههای ارسال شده به GEO در پایگاه اطلاعاتی و به سه شکل platform، Sample و Series ذخیره شده و به صورتهای DataSet و Profile به کاربران نمایش داده میشود.
۲۱۶-فصل نهم
تصویر ۱۷-۹: نمایش ورودی و خروجی اطلاعات در پایگاه GEO.
۶-۹ معرفی تعدادی از بانکها و ابزارهای پر کاربرد در ترنسکریپتومیکس
ArrayExpress: پایگاهی در EBI میباشد که دادههای ژنومیکس عملکردی را در خود ذخیره کرده است و پایگاه مناسبی برای دانلود دادههای خام و مقایسه بیان ژنهای متفاوت در بافتهای مختلف میباشد.
تصویر ۱۸-۹: نماد پایگاه ArrayExpress.
CGAP[۱] : وظیفهی آن کشف آناتومی مولکولی سلولهای سرطانی میباشد. در حقیقت این ابزار، پروفایلهای بیان ژن را به وسیلهی مقایسهی الگوهای بیان ژنی در سلولهای نرمال، پیش سرطانی و بدخیم بافتها مختلف ارائه میدهد.
UniGene DDD[۲]: ابزاری است که با استفاده از یک آزمون آماری، پروفایلهای بیان ژن کتابخانههای cDNA مورد نظر را مقایسه میکنند. به کمک این ابزار ژنهایی که سطوح بیانشان به طور معناداری از یک بافت به بافت دیگر متفاوت باشد، شناسایی میشوند.
PCR الکترونیکی[۳] : این ابزار اجازهی جستوجوی STSها (به عنوان نشانه یا راهنما[۴] در انواع مختلفی از نقشههای ژنومی) در توالی DNA مورد نظر را میدهد. منبع UniSTS حاوی تمام اطلاعات در زمینهی نشانگر STS از قبیل توالی آغازگر، طول محصول، اطلاعات نقشه و اسامی دیگر آن است.
Model Maker: امکان ایجاد توالی mRNA از روی توالی ژنوم را فراهم میکند. در حقیقت با کمک این ابزار میتوان برای ساخت یک مدل ژنی دلخواه و یا ویرایش مدل از راه انتخاب یا حذف اگزونهای مورد نظر بهره جست.
[۱]-The cancer gGenome Anatomy Project
[۲]-UniGene digital differential display
[۳]-Electronic PCR
[۴]-Landmark
۲۱۷-ترنسکریپتومیکس
ORF Finder: این برنامه ORFهای ممکنه در یک توالی DNA را به وسیلهی قرار دادن کدونهای شروع و پایان مشخص مینماید. همچنین توالی آمینواسیدی استنباط شده را میتوان با استفاده از ابزار BLAST در NCBI بررسی کرد.
SAGEmap: ابزاری برای انجام آزمونهای آماری برای تجزیه و تحلیلهای مختلف دادههای SAGE[۱] میباشد. با وارد کردن یک توالی تقاضا در منبع SAGEmap، میتوان فهمید که آیا قطعات SAGE در توالی وجود دارد یا خیر.
Spidey: همردیفی یک و یا بیش از یک توالی mRNA را با یک توالی ژنومی فراهم میکند. این برنامه همچنین ساختار اگزون / اینترون را تعیین خواهد کرد.
تصویر ۱۹-۹: نماد پایگاه Spidey.
Splign: برای محاسبهی همردیفیهای cDNA با DNA ژنومی براساس یک نوع ویژه از الگورتیم نیدلمن و وانچ به همراه ابزار BLAST عمل میکند.
تصویر ۲۰-۹: نماد پایگاه Splign.
Vec Screen: ابزاری برای شناسایی قطعات یک توالی اسید نوکلئیکی (که ممکن است حاصل یک حامل، لینکر یا سازگارساز باشد)، قبل از تجزیه توالی است.
Viral Genotyping Tool: یک برنامه مبتنی بر شبکه است، که ژنوتیپ توالیهای نوکلئوتیدی ویروسهای نوترکیب و غیرنوترکیب را مشخص میکند. این برنامه با کمک BLAST مقایسهی یک توالی ورودی را با مجموعهای از توالی منبع (با ژنوتیپهای شناخته شده) انجام میدهد. ژنوتیپهای منبع از قبل برای پاتوژن ویروس شامل HIV-1، هپاتیت C و هپاتیت B و همچنین پولوویروسها[۲] مشخص و در دسترس هستند.
پورتالBIO GPS : یک منبع مفید در زمینه میزان بیان ژنها میباشد که در کنار این اطلاعاتی در مورد ژنها در اختیار کاربران قرار میدهد. در تصویر ۲۱-۹ میزان بیان ژن TNF در بافتهای مختلف به نمایش گذاشته شده است.
تصویر ۲۱-۹: یک نمونه رکورد پورتال BIO GPS.
[۱]-Serial Analysis of Gene Expression
[۲]-Poliovirus
۲۱۸-فصل نهم
۷-۹ پدیده ترجیح کدونی
هنگامیکه فراوانی ذاتی کدهای ژنتیکی کشف شد دانشمندان درباره نقش جهشهای همنام (مترادف) سرگردان شده بودند، قاعده اصلی بیولوژی مولکولی حاکی از آن بود که جهشهای مترادف (آنهایی که آمینواسید کدگذاری شده را تغییر نمیدهند) هیچ اثری روی توالی پروتئین حاصله ندارند و در نتیجه هیچ اثری روی علمکرد سلولی، تکامل یا کارایی ارگانیسمی ندارند. با این وجود، در اکثر ژنومهای توالییابی شده، کدونهای مترادف با فراکانس برابری استفاده نمیشوند. این پدیده که codon usage bias نامیده میشود هماکنون از طریق تاثیراتش بر روی پروسههای متنوع از پردازش RNA گرفته تا ترجمه و فولدینگ پروتئین بهعنوان عامل مهمی در بیان ژن و عملکرد سلولی شناخته شده است.
کدونهای مختلفی که منطبق با آمینواسید یکسان میباشند بهعنوان مترادف در نظر گرفته میشوند، با این حال tRNAهای مطابق با آنها ممکن است میزانشان در سلول و در نتیجه سرعتی که در آنها بهوسیله ریبوزوم شناسایی میشوند نیز متفاوت باشد. همچنین توالی نوکلئوتیدی متفاوت برای یک پروتئین ممکن است منجربه تولید mRNAهایی با ساختار ثانویه و پایداری متفاوت شود، که ممکن است ترجمه و حتی تاخوردگی پروتئین را تحت تأثیر قرار بدهد. اکثر توالی DNA کدکننده پروتئین از کدونهای هممعنی با فرکانسهای بسیار متفاوتی استفاده میکنند. اولین گزارشات در مورد ترجیح کدونی به چهار دهه قبل برمیگردد. کلارک (۱۹۷۰) و بعداً ایکومورا (۱۹۸۱) و آکاشی (۱۹۹۴) پیشنهاد کردند که مصرف کدونی برای انطباق با استخر tRNA ارگانیسم سازش پیدا کردهاند. تفاوتهای مشاهده شده در codon bias بین گونهها نتیجه نیروهای تکاملی متفاوتی میباشند که این نیروها روی انتخاب کدونها عمل میکنند. مصرف کدونی نه تنها بین ارگانیسمها بلکه در ژنوم یک ارگانیسم هم میتوانند به میزان زیادی متفاوت باشند. در برخی مواد این پدیده میتواند به شدت قوی باشد مثلاً برخی گونهها مثل Thermus thermophiles از برخی کدونها تقریباً بهطور کامل اجتناب میکنند.
اثرات سازش کدونی بر سطوح بیان پروتئین هترولوگ نوترکیب
مطالعات زیادی در مورد اثرات کدونهای نادر بر بیان هترولوگ در E.coli انجام شده است. این مطالعات نشان داده است که وجود قطعاتی از کدونهای نادر AGA یا AGG موجب توقف حرکت ریبوزوم و برش mRNA، تغییر چارچوب ریبوزومی یا استفاده از آمینواسید اشتباه در طی ترجمه میشوند. کدونهایی که بهوسیله tRNAهای نادر خوانده میشوند ممکن است سرعت طویل شدن رشته پلی پپتیدی را تا چند برابر کاهش دهند. در ضمن قطعاتی از کدونهای AGG نزدیک محل اتصال ریبوزوم (RBS) میتواند با ایجاد مانع در مرحله شروع، ترجمه پروتئین را کاهش دهد.
بهطور کلی، هر چه میزان کدونهای نادر در ژن بیشتر باشد، احتمال کمتری وجود دارد که پروتئین هترولوگ در سطح خوبی بیان شود. وجود کدونهای نادر در بخش انتهایی N، سطح بیان پروتئین را به شدت کاهش میدهد. بنابراین یک راهحل معمول برای بهبود بیان این است که کدونهای نادر در ژن هدف طوری تغییر داده شوند که با الگوی ترجیح کدونی در میزبان بیانی هماهنگتر باشند. تکنیکهایی که برای این منظور استفاده میشوند از مراحل site – directed mutagenesis تا سنتز دوباره کل ژن را شامل میشوند.
با استفاده از نرمافزار DNA2.0 و روش ترجمه معکوس، تمام توالی کدونی محاسبه و بهترین توالی جهت بیان در میزبان بیانی مورد نظر را میتوان بهدست آورد. این نرمافزار با استفاده از الگوریتمهای مناسب کدونهای نادر را جایگزین و ساختارهای mRNA مشکلساز در رونویسی و ترجمه را برطرف میکند و با این روش عمل بهینهسازی کدونی (codon optimization) را انجام میدهد.