برای رعایت حریم خصوصی نام نگارنده پایان نامه درج نمی شود
(در فایل دانلودی نام نویسنده موجود است)
تکه هایی از متن پایان نامه به عنوان نمونه :
(ممکن است هنگام انتقال از فایل اصلی به داخل سایت بعضی متون به هم بریزد یا بعضی نمادها و اشکال درج نشود ولی در فایل دانلودی همه چیز مرتب و کامل است)
فهرست مطالب:
فصل اول: مقدمه 1
ضرورت انجام کار 6
نگاه کلی به فصول رساله 6
فصل دوم: پیشینه تحقیق 8
2-1- مقدمه 9
2-2- مقدمات زیستی 9
2-2-1- ژن 9
2-2-2- بیان ژن 10
2-2-3- شبکه های تنظیم کننده ژنی 11
2-3- روش های یاد گیری شبکه های تنظیم کننده ژنی 12
2-3-1- روش های مبتنی بر خوشه بندی 12
2-3-2- روش های مبتنی بر رگرسیون 13
2-3-3- روش های مبتنی بر اطلاعات متقابل 14
2-3-4- روش های تابعی 14
2-3-5- روش های مبتنی بر تئوری سیستم 14
2-3-6- روش های بیزین 15
فصل سوم: روش پیشنهادی 18
3-1- مقدمه 19
3-2- شبکه های بیزین دینامیک 20
3-3- یادگیری شبکه های بیزین دینامیک 22
3-3-1- روش های امتیازدهی بیزین 23
3-3-1-1- امتیازدهی به روش K2 25
3-3-1-2- امتیازدهی به روش BDe 26
3-3-2- روش های امتیازدهی بر اساس تئوری اطلاعات 26
3-3-2-1- امتیازدهی به روش log-likelihood (LL) 27
3-3-2-2- امتیازدهی به روش BIC 27
3-3-2-3- امتیازدهی به روش AIC 28
3-3-2-4- امتیازدهی به روش MIT 28
3-3-3– پیچیدگی زمانی یادگیری شبکه های بیزین دینامیک 29
3-4- شبکه های تصادفی و شبکه های Scale-free 31
3-5- روش پیشنهادی 35
فصل چهارم: نتایج تجربی 44
4-1- مقدمه 45
4-2- روش های تولید شبکه های Scale-free 46
4-3- روش های سنجش دقت برای شبکه های استنتاج شده 50
4-4- آزمایش اول: استفاده از روش جستجوی کامل 52
4-5- آزمایش دوم: نگاهی دقیق تر به عملکرد روش ارائه شده 54
4-6- آزمایش سوم: استفاده از جستجوی حریصانه 57
4-7- آزمایش چهارم: بازیابی قسمتی از شبکه تنظیمات ژنی در Yeast 60
4-8- آزمایش پنجم: : عملکرد روش ارائه شده در بازیابی شبکه های تصادفی 63
فصل پنجم: جمع بندی 67
5-1- نتیجه گیری 68
5-2- پیشنهاد برای کارهای آتی 69
منابع تحقیق 70
چکیده به زبان انگلیسی 74
فهرست جدول ها
جدول 4-1- نتایج بدست آمده به وسیله روش های مختلف برای استنتاج شبکه های Scale-Freeبا استفاده از داده های آموزشی به طول 50
جدول 4-2- نتایج بدست آمده به وسیله روش های مختلف برای استنتاج شبکه های Scale-Free با استفاده از داده های آموزشی به طول 100
54
54
فهرست شکل ها
شکل 3-1- مثالی از دو شبکه های بیزین تشکیل دهنده یک شبکه بیزین دینامیک
شکل 3-2- قالب اصلی الگوریتم یادگیری شبکه های بیزین دینامیک
شکل 3-3- شمای کلی توزیع دو جمله ای
شکل 3-4- شمای کلی توزیع قانون توانی
شکل 3-5- شبه کد الگوریتم ارائه شده برای یاد گیری شبکه های بیزین دینامیک با ساختار Scale-Free
شکل 3-6- شبه کد الگوریتم ارائه شده برای یاد گیری شبکه های بیزین دینامیک با ساختار Scale-Free با استفاده از روش جستجوی حریصانه
شکل 4-1- توزیع احتمالی درجه خروجی برای 1000 شبکه شامل 1000 گره تولید شده به وسیله الگوریتم شبیه سازی برای تولید شبکه های Scale-Free
شکل 4-2- توزیع احتمالی درجه ورودی برای 1000 شبکه شامل 1000 گره تولید شده به وسیله الگوریتم شبیه سازی برای تولید شبکه های Scale-Free
شکل 4-3- نمونه ای از شبکه جهت دار با ساختار Scale-Free
شکل 4-4- مقایسه بین نمونه های مختلف از الگوریتم پیشنهادی
شکل 4-5- نتایج بدست آمده به وسیله روش های مختلف برای استنتاج شبکه هایی با ساختار Scale-Free
شکل 4-6- قسمتی از زیر شبکه تنظیمات ژنی در Yeast
شکل 4-7- نتایج بدست آمده به وسیله روش های مختلف برای استنتاج قسمتی از زیر شبکه تنظیمات ژنی در Yeast
شکل 4-8- نتایج بدست آمده به وسیله روش های مختلف برای استنتاج شبکه های تظادفی
21
31
32
33
39
42
49
49
50
56
59
61
62
65
چکیده
شبکه های تنظیم کننده ژنتیکی مجموعه ای از ارتباطات ژن-ژن هستند که رابطه علت و معلولی را در فعالیت های ژنی ایجاد می کنند. دانش ما در مورد این شبکه ها نقش بسیار موثری در شناخت فرآیندهای زیستی ایفا می کند و می تواند باعث کشف روش های جدید برای درمان بیماری های پیچیده و تولید داروهای اثر گذار گردد.
روش های زیادی برای تشخیص شبکه های تنظیم کننده ژنتیکی پیشنهاد شده است. در این میان، شبکه های بیزین دینامیک مزایای ویژه ای دارا می باشند که باعث شده تا توجه زیادی را به خود جلب کنند.
با وجود تحقیقات انجام شده در این زمینه، مهندسی معکوس شبکه های تنظیم کننده ژن به وسیله شبکه های بیزین دینامیک به هیچ عنوان امری بدیهی نیست. غالباً تعداد نمونه های موجود برای آموزش مدل از تعداد مجهولات مسئله بسیار کمتر است. همچنین میزان پیچیدگی زیاد این مدل ها و دقت آنها از مهم ترین نواقص آن ها می باشند.
یکی از عمده ترین روش هایی که برای بالا بردن دقت شبکه های استنتاج شده به کار گرفته می شود استفاده از دانش اولیه در مورد شبکه های تنظیم کننده ژنی است. یکی از منابع عمده این دانش اولیه اطلاعات ما در مورد ساختار کلی شبکه های تنظیم کننده ژنی است. تحقیقات انجام شده نشان می دهند که تعداد یال های موجود در این شبکه ها کم است. همچنین شواهد بسیاری بدست آمده اند که نشان می دهند توزیع درجه خروجی در شبکه های تنظیم ژنی از قانون توانی پیروی می کنند. در واقع این شبکه ها در درجه خروجی scale-free هستند.
علیرغم این شواهد، روش های یادگیری شبکه های بیزین دینامیک این گونه شبکه ها را شبکه هایی با ساختار تصادفی در نظر می گیرند و یا تنها پیچیدگی شبکه را کنترل می کنند.
در این تحقیق روشی برای یاد گیری شبکه های بیزین دینامیک ارائه می شود که به طور مشخص بر این فرض شکل گرفته که شبکه واقعی ساختاری scale-free در توزیع درجه خروجی دارد. روش ارائه شده پیچیدگی زمانی چند جمله ای دارد و می تواند برای استنتاج شبکه هایی با تعداد گره های زیاد مورد استفاده قرار گیرد.
آزمایش هایی که برای مقایسه توانایی الگوریتم ارائه شده با متدهای قبلی یادگیری شبکه انجام شده اند نشان می دهند که الگوریتم ارائه شده، زمانی که برای استنتاج شبکه هایی استفاده می شود که scale-free هستند، قادر است کیفیت شبکه استنتاج شده را به خصوص زمانی که داده های آموزشی ناکافی هستند به صورت قابل توجهی افزایش دهد.
مقدمه
در هر سلول یک ارگانیزم زنده، هر لحظه، هزاران ژن با هم در ارتباط هستند تا فرآیندهای پیچیده زیستی را انجام پذیر سازند. شبکه های تنظیم کننده ژنتیکی[1] مجموعه ای از قسمت های DNA در سلول می باشد که به طور غیر مستقیم (به وسیله RNA یا پروتئین های تولیدی) با یکدیگر و مواد دیگر درون سلول ارتباط دارند و بدین طریق سرعت رونویسی[2] از روی ژن ها را برای تشکیل mRNA کنترل می کنند. هر مولکول mRNA یک پروتئین خاص با کارایی خاصی را تولید می کند. بعضی از پروتئین ها فقط برای فعال یا غیر فعال کردن ژن ها استفاده می شوند. این گونه پروتئین ها فاکتورهای رونویسی[3] نامیده می شوند و اصلی ترین نقش را در شبکه تنظیم ژنی ایفا می کنند. به بیان دیگر شبکه تنظیم کننده ژنتیکی مجموعه ای از ارتباطات ژن-ژن است که رابطه علت و معلولی را در فعالیت های ژنی ایجاد می کند. دانش ما در مورد این شبکه ها نقش بسیار موثری در شناخت فرآیندهای زیستی ایفا می کند و می تواند باعث کشف روش های جدید برای درمان بیماری های پیچیده و تولید داروهای اثر گذار گردد. از این رو تشخیص و مهندسی معکوس شبکه های تنظیم کننده ژنتیکی به یکی از مهم ترین زمینه های تحقیقاتی تبدیل شده است [1].
عموماً برای تشکیل شبکه های تنظیم کننده ژنتیکی از داده های Microarray استفاده می کنند. Microarray یک تکنولوژی است که قابلیت اندازه گیری هم زمان میزان بیان[4] mRNA مربوط به هزاران ژن را بوجود آورده است و می تواند اطلاعات مربوط به ارتباط ژن ها را در سطح ژنوم در اختیار ما قرار دهد [2]. اما راه حل ساده ای برای تشخیص شبکه های تنظیم کننده ژنتیکی از روی داده های Microarray وجود ندارد. در بیشتر موارد تعداد مجهولات مسئله بسیار زیاد است. این در حالی است که تعداد کمی داده در اختیار داریم. همچنین در بسیاری از موارد میزان خطا در اندازه گیری های موجود بالاست و یا با مشکل عدم وجود اندازه گیری برای بعضی از متغیرها مواجه هستیم.
داده های Microarray را می توان به دو نوع ایستا[5] و سری زمانی[6] تقسیم نمود. حالت اول تصویری است از بیان ژن ها در یک لحظه و شرایطی خاص. در حالت دوم بیان ژن ها در یک فرآیند درون سلولی در طول زمان اندازه گیری می شود. این سری های زمانی منعکس کننده فرآیندهای دینامیک درون سلولی هستند. اکثر روش های اولیه ای که برای آنالیز داده های سری زمانی Microarray استفاده می شدند در واقع روش هایی بودند که برای داده های ایستا طراحی شده بودند. در چند سال اخیر روش هایی برای کار با داده های سری زمانی به طور خاص مطرح شده اند که قادرند علاوه بر حل مشکلاتی که مخصوص داده های سری زمانی هستند، از ویژگی های منحصر به فرد این گونه داده ها نیز استفاده کنند. با این حال کار کردن با داده های سری زمانی نیازمند ظرافت و دقت بیشتری نسبت به داده های ایستا است و عمل مهندسی معکوس شبکه های تنظیم کننده ژنتیکی در این موارد مشکل تر است.
روش های زیادی برای تشخیص شبکه های تنظیم کننده ژنتیکی پیشنهاد شده اند که مهمترین آن ها عبارتند از: شبکه های بولین [3]، شبکه های بولین تصادفی [4]، معادلات دیفرانسیل [5] و
فرم در حال بارگذاری ...