بهبود عملکرد طبقه بندی داده های جریانی در حضور داده نامتوازن و تغییر مفهوم
تکرار نام مولف :
محمدعلی رشیدی محمودی
سال نشر :
1397
صفحه شمار:
59ص
یادداشت
چکیده
امروزه با افزایش سرعت و حجم دادهها با مفهومی به نام داده های جریانی برمیخوریم. داده های جریانی، دادههایی با حجم بالا میباشند که بهصورت افزایشی و سرعتبالا به سامانه وارد میشوند. همراه با این دادهها مفاهیم مختلفی مانند داده های نامتوازن و تغییر مفهوم به وجود می آید. از مهم ترین چالشهایی که در داده های جریانی مطرح می شود، تغییر الگوی توزیع داده ها در طول زمان بوده که به آن تغییر مفهوم می گویند. در این پایان نامه روشی جدید برای طبقهبندی داده های جریانی در حضور تغییر مفهوم و داده نامتوازن ارائه شده است. روش پیشنهادی دارای دو بخش است؛ بخش اول موسوم به MNOS که داده را با استفاده از تابع باور، تابع آشوبی و نمونه افزایی متوازن میکند و سپس در بخش دوم با استفاده از وزن دهی، محاسبه خطا و تعیین سه حد آستانه خطا تغییر مفهوم را شناسایی و در نهایت طبقه بندی می¬کند. هدف این روش بهبود عملکرد طبقه بندی داده های جریانی در حضور تغییر مفهوم و داده نامتوازن است. نتایج به دست آمده روی مجموعه¬داده¬های SEA، WEATHER و PIMA نشان از برتری روش پیشنهادی نسبت به روش های مشابه از جمله روش NSDS و OSELM است.
واژههای کلیدی: تغییر مفهوم، داده نامتوازن، تابع باور، تابع آشوبی، طبقهبندی برخط، نمونه افزایی