![]()
بهینهسازی مدلهای موجودی تحت سیاست مدیریت موجودی توسط فروشنده، با استفاده از الگوریتم Q-Learning (1394) / احمدی ، حمیده، نویسنده
نوع مدرک: متون چاپی سرشناسه احمدی ، حمیده، نویسنده عنوان : بهینهسازی مدلهای موجودی تحت سیاست مدیریت موجودی توسط فروشنده، با استفاده از الگوریتم Q-Learning تکرار نام مولف : حمیده احمدی سال نشر : 1394 صفحه شمار: 97ص یادداشت چکیده
رقابت جهانی سازی در بازارها و کسبوکار، تعداد زیادی از شرکتها را بر آن داشته تا جهت افزایش پاسخگویی به تغییرات بازار در صدد تقویت زنجیرهتامین خود برآیند. از جمله این تلاشهامیتوان به تجدید و تقویت سیستم کنترلموجودی اشاره کرد. با این حال تجربه در صنایع مختلف نشان داده که کنترلموجودی به دلیل عدم قطعیت و غیرایستا بودن تقاضای مشتریان امری آسان نیست.
مدیریت موجودی توسط مشتری (VMI) سیستم نسبتا جدیدی است که در آن توزیعکننده مسئولیت کنترل و بازپرسازی موجودی خردهفروشان را برعهده دارد. در سالهای اخیر با پیشرفت فناوری اطلاعات از یک سو و افزایش رقابت از سوی دیگر این سیستم مورد توجه بسیاری از زنجیرههای تامین کالا قرار گرفته است.
ابرازهای مدرن هوش مصنوعی نظیر یادگیری تقویتی، این توانایی را دارند که بر مبنای منطق تصمیمگیری عامل انسانی، به شکل روباتهای نرم افزاری هوشمند و خود مختار، با تبعیت از مکانیزم تفکر و استدلال انسانی و بر مبنای دانش موجود و آنچه که در عمل از محیط پیرامون میآموزند، چرخه حیات یک سیستم را به دست گیرند وسیستم را اداره نمایند.
در این راستا در این پژوهش از تلفیق این دو- مدیریت موجودی توسط فروشنده و یادگیری تقویتی- استفاده شده است و به مدیریت زمان سفارشدهی و مقدار سفارش در یک زنجیرهتامین سهسطحی پرداخته شده است. در این پایاننامهیک زنجیرهتامین شامل عامل توزیعکننده و خردهفروش و مشتری در نظر گرفته شده است، که عامل توزیعکننده مسئول پایش و کنترلموجودی خردهفروش است. تقاضای مشتری نهایی غیرایستا بوده و توسط روشهای پیشبینی تقاضا، نظیر هموارسازی نمایی، هموارسازی خطی هولت پیشبینی میگردد. برای تعدیل خطای تخمین تقاضا دو مقدار احتیاطی تحت عناوین مدت تحویل احتیاطی و مقدار بازپرسازی احتیاطی به ترتیب برای سیستم موجودی مرور دائم و مرور دوره ای ارائه گردیده، که بسته به شرایط مقدار مثبت یا منفی اتخاذ میکنند. هدف از پژوهش ارائه یک روش یادگیری تقویتی است که مقادیر احتیاطی را به نحوی اتخاذ نماید که کمترین هزینه موجودی را به سیستم اعمال نماید. برای پیاده سازی این امر از روش یادگیری تقویتیQ-Learning استفاده گردیده است. مقایسه با مدل روزنامه فروش اسکارف برای مدل مرور دوره ای و مدل عمل-ارزش برای مدل مرور دائم، حاکی از عملکرد قوی یادگیری تقویتی Q-Learning در هر دو مدل مذکور میباشد.
واژگان کلیدی: مدیریت زنجیرهتامین، مدیریت موجودی توسط فروشنده،یادگیری تقویتی، مقدار بازپرسازی احتیاطی، مدت تحویل احتیاطیشناسه افزوده : باقری ، محسن، استاد راهنما لینک ثابت رکورد: ../opac/index.php?lvl=record_display&id=14407 زبان مدرک : فارسی
درخواست رزرو
شماره ثبت شماره بازیابی نام عام مواد محل نگهداری بخش وضعیت ثبت وضعیت امانت 245پ 245پ پایاننامه کتابخانه سجاد مهندسی صنایع اسناد معمولی موجود