ارائه روشی جدید در استراتژی قیمت دهی تولیدکنندگان در بازار برق رقابتی برپایه الگوریتم یادگیری تقویتی (مطالعه موردی بازار برق خراسان) (1396) / ناصری جوارشک ، محمدعلی، نویسنده
نوع مدرک: متون چاپی سرشناسه ناصری جوارشک ، محمدعلی، نویسنده عنوان : ارائه روشی جدید در استراتژی قیمت دهی تولیدکنندگان در بازار برق رقابتی برپایه الگوریتم یادگیری تقویتی (مطالعه موردی بازار برق خراسان) تکرار نام مولف : سید محمد علی ناصری جوارشک سال نشر : 1396 صفحه شمار: 84ص یادداشت چکیده
در دو دهه گذشته، صنعت برق بسیاری از کشورها تحت فرآیند تجدیدساختار در حال حرکت به سمت تجاریسازی
و رقابت قرارگرفته است. در این فرآیند، کشورهای مختلف با مدلهای متفاوتی در جهت رقابتی کردن این صنعت
هستند. در فضای رقابتی، این صنعت نیازمند تدوین قوانینی برای بهرهبرداری مناسب و رسیدن به اهداف تجدیدساختار
میباشد. همچنین بازیگران بازار نیازمند ابزاری جهت تحلیل مسائل گوناگون خود می باشند.
امروزه استراتژی قیمتدهی، به یکی از مهمترین مسائل برای تولیدکنندگان تبدیل شده است. استراتژی قیمتدهی
بهینه به این معنی است که چگونه میتوان با ارائه یک پیشنهاد قیمت مناسب حداکثر سود ممکن را در یک بازه
زمانی مشخص بدست آورد. تولیدکنندگان انرژی، همواره بهدنبال راهی برای آزمایش استراتژیهای خود میباشند. اما
باید در نظر داشت که آزمایش یک روش جدید بر روی یک شبکه واقعی، کاری مشکل، زمانبر و ریسکپذیر است.
از این رو، استفاده ازروشهای شبیهسازی بازار به عنوان یک ابزار مؤثر مورد توجه قرار گرفته است. برای شبیهسازی
بازار برق تاکنون روشهای زیادی مورد استفاده قرار گرفته است ولی در سالهای اخیر، روشهای حل مسأله یادگیری
تقویتی با توجه بیشتری همراه بوده است.
در این پایاننامه از الگوریتم یادگیری- Q و مسیرهای شایستگی به عنوان روشهای حل مسأله یادگیری تقویتی
استفاده شده است. با استفاده از الگوریتم یاد شده میتوان رفتار تولیدکنندگان بازار را شناسایی کرد و پیشنهاد قیمت
مناسبی برای دستیابی به حداکثر سود ارائه نمود. برای ارزیابی روش پیشنهادی، در مرحله اول تحت سیستمهای
نمونهای به بررسی مسائل پایه در بازار رقابتی پرداخته میشود. سپس تحت یک مدل واقعی از بازار برق)بازار برق
خراسان(، به تحلیل رفتار تولیدکنندگان میپردازیمشناسه افزوده : حسن پور ، سمیه، استاد راهنما نوری ، امین، نویسنده لینک ثابت رکورد: ../opac/index.php?lvl=record_display&id=18193 زبان مدرک : فارسی
شماره ثبت شماره بازیابی نام عام مواد محل نگهداری بخش وضعیت ثبت وضعیت امانت 304پ 304پ پایاننامه کتابخانه سجاد برق اسناد مرجع غیر قابل امانت
نوع مدرک: متون چاپی سرشناسه دهقان ، مسعود، نویسنده عنوان : ارزیابی تهدید و تخصیص سلاح با استفاده از منطق فازی و یادگیری تقویتی تکرار نام مولف : مسعود دهقان سال نشر : 1397 صفحه شمار: 49ص یادداشت چکیده
در جنگ های امروزی دیگر مثل زمان قدیم نیست که دو طرف جنگ بدترین خسارات را به طرف مقابل وارد کنند. بنابراین راهبردی باید در نظر گرفته شود تا بهترین حالت ممکن برای دفاع از دارایی ها و مراکز مهم بوجود آید تا اینکه آسیبی یا نبینند یا اینکه حداقل کمترین آسیب بر آنها وارد شود. در این بین راهبرد دفاع موشکی یکی از عوامل موثر در حفظ حریم هوایی کشور است, همچنین استفاده از دیگر سیستم های تسلیحاتی مانند پدافندهای هوایی می توانند نقش بسزایی در حفظ حریم هوایی یک کشور ایجاد کنند تا آن کشور در برابر خطرات احتمالی محافظت شود.
اما موضوع مورد بحثی که در اینجا قرار دارد اینجاست که ما بتوانیم با استفاده از سیستم های تسلیحاتی موجود بهترین تصمیم و عملکرد را در برابر حملات بیگانگان که موجب خطرات بسیاری برای ما می شوند را داشته باشیم و این عملکرد بهینه مستلزم ارزیابی تهدید و تخصیص سلاح است. با ارزیابی تهدید بوجود آمده و با استفاده از روش های کنترلی موجود مانند الگو ریتم ژنتیک، یادگیری تقویتی، فازی و.... می توان با تخصیص سلاح مناسب به دارایی های موجود به بهترین شکل ممکن استفاده کرد تا درصد بقاء دارایی ها به حداکثر ممکن برسد و در ضمن بقاء هدف ها که به حریم ما در منطقه حمله کردند به حداقل برسدشناسه افزوده : نوری ، امین، استاد راهنما لینک ثابت رکورد: ../opac/index.php?lvl=record_display&id=25363 زبان مدرک : فارسی
شماره ثبت شماره بازیابی نام عام مواد محل نگهداری بخش وضعیت ثبت وضعیت امانت 566پ 566پ پایاننامه کتابخانه سجاد برق اسناد مرجع غیر قابل امانت استفاده از منطق فازی و یادگیری تقویتی در کنترل گلوکز پلاسما در بیماران دیابتی (1397) / حسنی آسیابدره ، حامد، نویسنده
نوع مدرک: متون چاپی سرشناسه حسنی آسیابدره ، حامد، نویسنده عنوان : استفاده از منطق فازی و یادگیری تقویتی در کنترل گلوکز پلاسما در بیماران دیابتی تکرار نام مولف : حامد حسنی آسیابدره سال نشر : 1397 صفحه شمار: 67ص یادداشت چکیده
تغییر در روش زندگی افراد و تغییر در ژنتیک بیماریها باعث شده است که پیشنهادهای جدیدی برای مقابله با بیماری ها اتخاذ شود.کنترل بیماری دیابت یکی از پر اهمیتترین مساله سالهای اخیر بشر است. مقصود این نوشتار کنترل بیماری دیابت با استفاده از منطق فازی و یادگیری تقویتی در حضور عدمقطعیت و اغتشاشات ناشی از فعالیت ناگهانی و مصرف غذا در فرد مبتلا به دیابت است. به این منظور از مدل ریاضی پالمبو به عنوان تشریح کننده مدل بیماری دیابت استفاده شده تا با کنترلر پیشنهادی طراحی شده با منطق فازی و یادگیری تقویتی شرایط بیمار شبیهسازی و کنترل بهتری روی بیماری صورت بگیرد.
تغییرات گلوکز موجود در خون بررسی شده تا نیاز به انسولین و مقدار تزریقی انسولین بر پایه توابع عضویت در یک سیستم خبره تخمین زده شد و در هر لحظه شرایط بیمار قابل کنترل بود. استفاده از یادگیری تقویتی در مورد کنترل دیابت با داشتن یک فضای مارکوف نیز مد نظر بود که نقطه قوت این پایاننامه است تا بدون دسترسی به اطلاعات قبلی از شرایط بیمار به کنترل بیماری بپردازد. سعی در این پایاننامه بر آن است که توان کنترل بیماری با روشهای هوشمند بررسی گردد تا از این امکان در بهبود شرایط زندگی بشر استفاده بهتری صورت بگیرد که در ادامه به آن میپردازیم.
کلمات کلیدی: یادگیری تقویتی، منطق فازی، کنترل فازی ، دیابت، گلوکز، انسولینشناسه افزوده : نوری ، امین، استاد راهنما کفایی رضوی ، دکتر مرتضی، استاد راهنما لینک ثابت رکورد: ../opac/index.php?lvl=record_display&id=25055 زبان مدرک : فارسی
شماره ثبت شماره بازیابی نام عام مواد محل نگهداری بخش وضعیت ثبت وضعیت امانت 534پ 534پ پایاننامه کتابخانه سجاد برق - کنترل اسناد مرجع غیر قابل امانت تشخیص و کنترل سرطان ملانوما با استفاده از روشهای هوشمند و مدلسازی آن (1397) / کلهر ، الناز، نویسنده
نوع مدرک: متون چاپی سرشناسه کلهر ، الناز، نویسنده عنوان : تشخیص و کنترل سرطان ملانوما با استفاده از روشهای هوشمند و مدلسازی آن تکرار نام مولف : الناز کلهر سال نشر : 1397 صفحه شمار: 144ص یادداشت چکیده
سرطان ملانوما یکی از شایعترین انواع سرطان پوست میباشد که تشخیص دقیق، سریع و درمان بهموقع آن امری بسیار مهم میباشد. به همین دلیل در دو دهه گذشته تشخیص و درمان این نوع سرطان با استفاه از روشهای هوشمند در کنار کار پزشکان بسیار مورد توجه قرار گرفته است.
در این پایان نامه برای تشخیص سرطان ملانوما به پیادهسازی چند روش هوشمند پرداخته شده است. این روشها شامل شبکه عصبی پیشرو، RBFN، GRNN، SVM، KNN ، الگوریتم بیز و شبکه یادگیری عمیق (CNN) میباشند. مجموعه داده انتخاب شده شامل 515 عکس از ضایعه مربوط به بیماران مبتلا به ملانوما و افراد سالم میباشد (مجموعه داده انتخاب شده شامل 515 عکس ملانوما و خال گوشتی میباشد). تمامی این تصاویر از سایت (ISIC) گرفته شدهاند. ابتدا مطابق با کار مقالات پیشین، پیشپردازش هایی بر روی تصاویر انجام گرفته است و سپس توسط ماتریس GLCM، شش ویژگی از تصویر استخراج شده است. ویژگیهای استخراج شده به عنوان ورودی برای هر یک از روشهای ذکر شده به جز CNN که ورودی آن تصویر میباشد، در نظر گرفته شدهاند. در انتها نشان داده شده است که الگوریتم بیز نسبت به سایر روشها با دقت بالاتر و حدود 99% توانسته است ضایعه سرطانی و غیر سرطانی را از یکدیگر تفکیک کند.
برای کنترل سرطان ملانوما نیز، برای اینکه رفتار مدلهای مختلف مورد بررسی قرار بگیرد، ابتدا با استفاده از الگوریتم ژنتیک کنترل سلولهای سرطانی بر روی مدل ارایه شده توسط کاستیکلیون و پیکلی انجام گرفته است. این روش با روش تزریق دوز داروی ثابت مقایسه شده است. در نهایت نشان داده شده است که هر دو روش توانستهاند سلولهای سرطانی را کنترل کنند، اما دوز داروی تزریقی توسط روش الگوریتم ژنتیک در کل مدت درمان بسیار کمتر بوده است که این امر کاهش اثرات زیانبار دارو را به همراه خواهد داشت. در مرحله بعد، کنترل سلولهای سرطانی توسط همین مدل با استفاده از روش یادگیری Q که یکی از روشهای حل مسئله یادگیری تقویتی میباشد، انجام گرفته است. در این مرحله نیز روش یادگیری تقویتی با روش کنترل بهینه که یکی از روشهای کنترل کلاسیک میباشد، و همچنین روش تزریق دوز داروی ثابت مقایسه شده است. در انتها نیز برای نشان دادن یکی از مزایای روش یادگیری تقویتی که تطبیقپذیری آن با محیط میباشد، با اعمال نویز به سیستم و عدم قطعیت در پارامترهای سیستم و شرایط اولیه، کنترل سلولهای سرطانی در دیگر بیماران مبتلا به سرطان ملانوما انجام گرفته است. در گام بعدی، از مدل ریاضی ارایه شده توسط مرزیون پنیسی استفاده شده است و کنترل سلولهای سرطانی در بیمار مبتلا به سرطان ملانوما توسط روش مسیرهای شایستگی انجام گرفته است. لازم به ذکر میباشد که بر روی این مدل هیچ نوع روش کنترلی پیادهسازی نشده است و این اولین باری میباشد که کنترل جمعیت سلولهای سرطانی توسط این مدل انجام گرفته است. در این مرحله نیز روش ذکر شده با روش تزریق دوز داروی ثابت مقایسه شده است. همچنین اعمال نویز به سیستم و عدم قطعیت در پارامترهای سیستم و شرایط اولیه نیز انجام شده است.
ایجاد مدل ریاضی از رشد و تکثیر سلولی به شبیهسازی دقیق از رفتار سیستم دفاعی برای مقابله با سلولهای سرطانی، کمک میکند. همچنین بدست آمدن یک الگوی مناسب برای تزریق دوز دارو و کاهش اثرات زیانبار آن را ممکن میشود. در این پایاننامه به مدلسازی رفتار سیستم دفاعی بدن برای یک بیمار مبتلا به سرطان ملانوما پرداخته شده است. در این مدل از 9 پارامتر تاثیرگذار در عملکرد سیستم دفاعی در مقابله با سلولهای سرطانی استفاده شده است. مزیت اصلی این مدل در مقایسه با دیگر مدلهایی که برای بیمار مبتلا به سرطان ملانوما وجود دارد، میتوان به در نظر گرفتن تعداد متغیرهای بیشتر برای بیان دینامیک بدن بیمار مبتلا به سرطان ملانوما اشاره کرد که این امر باعث نزدیکی هر چه بیشتر مدل بیان شده به بیمار واقعی خواهد شد. برای تخمین ضرایب مدل ریاضی ذکر شده از یکی از روشهای بهینهسازی چند هدفه به نام روش "الگوریتم ژنتیک چند هدفه با مرتب سازی نامغلوب" استفاده شده است. از مزایای این روشها میتوان به در نظر گرفتن چند تابع هدف و محدود کردن همزمان آنها اشاره کرد. نتایج حاصل از شبیهسازی نشان داده است که مدل ریاضی طراحی شده، کاملا رفتار سیستم دفاعی بدن بیمار مبتلا به سرطان ملانوما را شبیهسازی میکند. برای آنالیز حساسیت و تعیین میزان همبستگی خروجی مدل ریاضی به تغییرات برخی پارامترها از روش "ضریب همبستگی درجه جزئی"با نام اختصاریPRCC استفاده شده است.
کلیدواژهها: سرطان ملانوما، تشخیص سرطان، ماتریسGLCM، کنترل سرطان، الگوریتم ژنتیک، یادگیری تقویتی، یادگیری Q، مسیرهای شایستکی، استدلال مبتنی بر مورد(CBR)، دوز بهینه دارو، مدلسازی، آنالیز حساسیتشناسه افزوده : نوری ، امین، استاد راهنما توکل افشاری ، جلیل، استاد راهنما لینک ثابت رکورد: ../opac/index.php?lvl=record_display&id=25350 زبان مدرک : فارسی
شماره ثبت شماره بازیابی نام عام مواد محل نگهداری بخش وضعیت ثبت وضعیت امانت 553پ 553پ پایاننامه کتابخانه سجاد برق اسناد مرجع غیر قابل امانت
نوع مدرک: متون چاپی سرشناسه موذن نجمآباد ، مهدی، نویسنده عنوان : طراحی بهینه سلولی با استفاده از یادگیری تقویتی تکرار نام مولف : مهدی موذن نجمآباد سال نشر : 1397 صفحه شمار: 34 ص یادداشت چکیده
در این پایاننامه، با استفاده از روشهای حل مسأله یادگیری تقویتی ، امکان افزایش بهینه ظرفیت در شبکههای مخابرات سیار سلولی، با بکارگیری روش قطاعبندی یکسان چرخشپذیر مورد بررسی قرار گرفته است. استفاده از روش قطاعبندی یکسان چرخشپذیر و گردش مناسب سکتورها در مواقع لزوم، میتواند سبب کاهش رد تقاضای مشترکین در مناطق پرتراکم و در نتیجه افزایش ظرفیت شبکه گردد. نحوه گردش سکتورها با توجه به توزیع غیریکنواخت مشترکین در ساعات و مناطق مختلف، به گونهای است که در هر مرحله در صورت وجود ظرفیت خالی در سایر سکتورها، ناحیه پرتراکم با تعداد سکتور بیشتری پوشش داده میشود. در این پایاننامه از الگوریتم یادگیری کیو که یکی از روشهای حل مسأله یادگیری تقویتی میباشد، جهت تعیین نحوه گردش و زاویه چرخش بهینه استفاده شده است.
مزیت بکارگیری الگوریتم یادگیری کیو در حل مسأله فوق در این است که در این روش یادگیری، عامل بدون داشتن مدل محیط و تنها از طریق سعی و خطا و تعامل مستقیم با محیط، عمل بهینه را یاد میگیرد. شبکه مورد بررسی در این پایاننامه شبکهای متشکل از دو سلول مخابراتی بوده که سکتورهای ایستگاه پایه در یکی از سلولها امکان چرخش در زوایا و جهتهای مختلف را دارا میباشد. نتایج شبیهسازیهای انجام شده نشان میدهد استفاده از الگوریتم فوق به خصوص در ساعات پرترافیک، باعث افزایش ظرفیت سیستم میگردد.
کلیدواژهها: مخابرات سیار، طراحی سلولی، قطاعبندی، یادگیری تقویتی، Q-learningشناسه افزوده : احدی اخلاقی ، ایمان، استاد راهنما نوری ، امین، استاد راهنما لینک ثابت رکورد: ../opac/index.php?lvl=record_display&id=25064 زبان مدرک : فارسی
شماره ثبت شماره بازیابی نام عام مواد محل نگهداری بخش وضعیت ثبت وضعیت امانت 544پ 544پ پایاننامه کتابخانه سجاد برق - مخابرات اسناد مرجع غیر قابل امانت مسیریابی بهینه در سیستم دینامیکی ترافیک با استفاده از یادگیری تقویتی (مطالعه موردی:منطقه 12 شهرداری مشهد) (1397) / فرخی ، مریم، نویسنده
نوع مدرک: متون چاپی سرشناسه فرخی ، مریم، نویسنده عنوان : مسیریابی بهینه در سیستم دینامیکی ترافیک با استفاده از یادگیری تقویتی (مطالعه موردی:منطقه 12 شهرداری مشهد) تکرار نام مولف : مریم فرخی سال نشر : 1397 صفحه شمار: 49ص یادداشت چکیده
با ازدیاد وسایل نقلیه در جامعه بشری و اهمیت یافتن بیش از پیش زمان برای بشر، کنترل ترافیک خود را به صورت یک موضوع کاملا ضروری نشان داده است. کنترل توسط روش¬های مرسوم و سنتی، دیگر جوابگوی ممتازی برای این امر نخواهد بود. چراکه ترافیک، سیستمی متغیر با زمان، غیر خطی، فازی و اغلب اوقات تصادفی و نامعلوم است. در این طرح به بررسی بهترین و بهینه¬ترین مسیر از یک مبدا تا مقصد مشخص می¬پردازدکه این انتخاب باید به صورت آنلاین باشد و مطابقت با پارامترهای استاتیکی و دینامیکی آن لحظه ازسیستم ترافیک را داشته باشد.در اینجا ابتدا از روش هوشمند برای پیداکردن مسیر بهینه با توجه به پارامتر استاتیکی مسافت استفاده شده است و سپس پارامتر ترافیک به عنوان پارامتر دینامیک به آن اضافه شده است که به روش استفاده از یادگیری تقویتی سارسا و یادگیری Q است. این روش¬ ها به دلیل عدم نیاز به مدل سیستم و اطلاعات حجیم اولیه، و همچنین خاصیت خودیادگیری و قوام¬دار بودن، پیشنهاد شده است. و در انتها این پژوهش با یک مطالعه موردی بر روی یکی از مناطق مشهد پیاده¬سازی شده است.
کلیدواژهها:ترافیک، مسیر بهینه، یادگیری تقویتی سارسا، یادگیری تقویتی Qشناسه افزوده : نوری ، امین، استاد راهنما لینک ثابت رکورد: ../opac/index.php?lvl=record_display&id=25411 زبان مدرک : فارسی
شماره ثبت شماره بازیابی نام عام مواد محل نگهداری بخش وضعیت ثبت وضعیت امانت 614پ 614پ پایاننامه کتابخانه سجاد برق - کنترل اسناد مرجع غیر قابل امانت
نوع مدرک: متون چاپی سرشناسه موسوی ، غزاله، نویسنده عنوان : کنترل دوزدارو در پروسه شیمی درمانی با استفاده از یادگیری تقویتی تکرار نام مولف : غزاله موسوی سال نشر : 1397 صفحه شمار: 80ص یادداشت چکیده:
سرطان از جمله مشکلات جدی سلامت جوامع امروزی است که تلاش های بسیار گسترده ای برای مقابله با آن در حال انجام است. با این وجود در بسیاری از موارد با سلول های سرطانی می توان با راهکارهای درمانی ارایه شـده مقابله کرد که درمیان روش های بروز, شیمی درمانی از درمان های موثربرای کاهش رشـد سـریع تر تومور به حساب می¬آید.
کنترل دقیق وپایدارمتغیرهای حیاتی دربیمارانی که سیستم کنترل طبیعی انها به دلیلی با مشکل طبیعی مواجه شده اند امری ضروری است. دربرخی از بیماریهای خطیر، مصرف دارو از اهمیت بسیاری برخوردار است. تنظیم مقدار و دفعات مصرف دارو مصرفی امری حائز اهمیت در مصرف دارو محسوب می شود. علی رغم اینکه هر دوزی از دارو دارای اثرات مفید منحصر به خود است، اثرات زیانباری برروی سلول های طبیعی یا سلول های سالم بدن نیز دارد. از سوی دیگر با کنترل دوز دارو، عوارض مطلوبی ایجاد و با افزایش دوز دارو، این عوارض تشدید می شود. در این مسئله باید به دو نکته مهم که در غالب ویژگی دارو و شرایط بیمار مطرح می شود، توجه داشت. دراین پروژه, هدف کنترل دوز دارو برای بیماران سرطانی در زمان گذراندن پروسه شیمی درمانی می باشد و در این رساله، این عمل با استفاده از روش¬های هوشمند یادگیری تقویتی وکنترل عصبی تحقق پذیرفته است.
استفاده از سیستم های هوشمند به اجرای درمان با کارایی بالاتر کمک کند و به پزشک کمک میکند که تصمیم های سریع و مؤثرتری در مورد مقدار دوز مصرفی دارو بگیرد و دو روش به کار رفته دارای انعطاف پذیری و سادگی نسبی می باشد که می تواند به بهبود درمان برای بیماران با ویژگی های منحصربه فرد شود.
درابتدای درمان یک دوز داروی مشخص برای شخص سرطانی به کار می رود. درهربازه زمانی کوتاه, دوز دارو درهرمرحله کاهش تاعوارض جانبی دارو کاهش یابد. دراین تحقیق زمان وسرعت درمان وکاهش دوز دارو از دیگر پارامترهایی بوده است که مورد توجه قرارگرفته است. این مدل تعداد سلول های تومور,گلبول های سفید,میزان گردش لنفوسیت درخون را نیز مورد بررسی قرار می دهد.
همچنین وضعیت پنج بیمار با شرایط مختلف ازنظر میزان دوز داروی مصرفی وکاهش سلول های تومور و افزایش سدهای دفاعی بدن بررسی می شود. و اثر نویز و اغتشاش برمدل توسط دوکنترلر اعمال شده است.
کلمات کلیدی : یادگیری تقویتی، کنترل عصبی، کنترل دوز دارو، شیمی درمانیشناسه افزوده : نوری ، امین، استاد راهنما لینک ثابت رکورد: ../opac/index.php?lvl=record_display&id=25043 زبان مدرک : فارسی
شماره ثبت شماره بازیابی نام عام مواد محل نگهداری بخش وضعیت ثبت وضعیت امانت 522پ 522پ پایاننامه کتابخانه سجاد برق - کنترل اسناد مرجع غیر قابل امانت
نوع مدرک: متون چاپی سرشناسه عربی ، علیرضا، نویسنده عنوان : کنترل سیگنال ترافیک تکرار نام مولف : علیرضا عربی سال نشر : 1396 صفحه شمار: 116ص یادداشت چکیده:
سیستم حمل و نقل و راهبری از مهمترین فاکتورها در افزایش رفاه اجتماعی، توسعه و آبادانی هر کشوری میباشد. امروزه
علاوه بر افزایش حجم ترافیکی وسایل نقلیه، تقاضا برای حمل و نقل ایمن و کارا، نیز افزایش یافته است. این امر باعث
شده امروزه با مشکلاتی از جمله افزایش مدت زمان تلف شده، آلودگی محیط زیست، گرم شدن کره زمین، افزایش
بیماریها ازجمله سرطان ریه، افزایش مصرف سوخت و مسدود شدن تقاطعها رو به رو باشیم.
در این میان چراغ راهنمایی، بدون شک یکی از آشناترین و مهمترین وسایل در کنترل، تنظیم عبور و مرور وسایل نقلیه
و افزایش ایمنی سطح تقاطعها میباشد. امروزه با افزایش وسایل نقلیه به طور پیوسته، محدودیت در منابع ارائه شده
توسط زیر ساختهای فعلی و ماهیت غیرخطی، پویا و تصادفی جریان ترافیکی، استفاده از روشهای یادگیری تقویتی،
الگوریتم ژنتیک، منطق فازی و شبکه عصبی در کنترل هوشمند ترافیک حائز اهمیت است.
در این پایاننامه، استراترژی کنترل بر پایه انتخاب نوع چراغ و مدت زمان فاز سبز برای رسیدن به یک تعادل زیربهینه در
تقاطعها میباشد. این تعادل، میبایست قابلیت تطبیقپذیری با رفتار تغییرپذیر با زمان و تصادفی بودن ترافیک را داشته
باشد. بنابراین هدف سیستم کنترلی، افزایش ظرفیت اداره کردن یک تقاطع یا شبکه، کاهش حجم ترافیک وسایل نقلیه،
متوسط زمان تاخیر خودروها، ارجحیت دادن به خودروهای اضطراری و کنترل تصادفات است. در این پایاننامه، دو نوع
محیط ترافیک شبیهسازی شده است. در محیط اول یک تقاطع منفرد و در محیط دوم یک شبکه متشکل از چند تقاطع)نه
تقاطع، پنج تقاطع و دو تقاطع(شبیهسازی شده است. برای نزدیکتر کردن مدل شبیهسازی شده به مدل واقعی، اهمیت)تعداد ورودی و خروجی خودروها(هر خیابان از تقاطع نسبت به خیابان دیگر متفاوت است، در میزان خروجی و ورودی
خودروها در هر خیابان، نسبت به عمل چراغ راهنمایی از توزیع نرمال استفاده شده است. همچنین در طول مدت زمان
شبیهسازی اغتشاشهایی از جمله، تصادف و ساعت اوج ترافیک نیز لحاظ شده است.
برای کنترل سیگنال ترافیک، از الگوریتم ژنتیک 1 استفاده شده است که نسبت به روش کلاسیک، ثابت زمانی عملکرد
بهتری دارد. اما به دلیل کند بودن، نیازمند به مدل ریاضی محیط و عدم تطبیقپذیر با محیط روش کاربردی نیست. برای
حل این مشکلات از یادگیری تقویتی استفاده شده است. در کنترل ترافیک به کمک یادگیری تقویتی، سناریوهای مختلفی
از جمله یادگیری تقویتی 24 کنشی، 40 کنشی، مقایسه روشهای آموزشی عامل یادگیرنده)یادگیری Q2 ، سارسا 3 و
مسیرهای شایستگی 4 (و کنترل ترافیک با درنظر گرفتن خودروهای اضطراری بررسی شده است. در ادامه به بررسی کنترل
سیگنال ترافیک در شبکههای ترافیکی پرداخته شده است و سه روش یادگیری تقویتی چند عامله تک سطحی، یادگیری
1 GA
2 Q-learning
3 Sarsa
4 Eligibility Traces
ب
تقویتی چند عامله دو سطحی و یاگیری تقویتی نش، مورد بررسی قرار گرفت. در ادامه با ترکیب روشهای هوشمند از
جمله یادگیری تقویتی، الگوریتم ژنتیک، منطق فازی 1 و شبکه عصبی 2 عملکرد سیستم کنترلی ترافیک بهبود یافته است و
مشکلاتی از جمله، عدم تعیین بهینه نرخ یادگیری و نرخ فراموشی، تعداد زیاد عملها و حالات عامل یادگیرنده برطرف
شد. در نهایت به سیستم کنترل ترافیک با یادگیری تقویتی، قابلیت تشخیص، شناسایی و کنترل خطا 3 اضافه شده است.برای
تشخیص و کنترل خطا در حسگرها و چراغهای راهنمایی از مدل ریاضی چند ورودی چند خروجی و متغیر با زمان،
فیلتر کالمن، یادگیری تقویتی و الگوریتم ژنتیک استفاده شده است.
1 Fuzzyشناسه افزوده : نوری ، امین، استاد راهنما لینک ثابت رکورد: ../opac/index.php?lvl=record_display&id=18270 زبان مدرک : فارسی
شماره ثبت شماره بازیابی نام عام مواد محل نگهداری بخش وضعیت ثبت وضعیت امانت 311پ 311پ پایاننامه کتابخانه سجاد برق - کنترل اسناد مرجع غیر قابل امانت