بهبود نرخ صحت در طبقهبندی تککلاسه دادههای جریانی ایستا با قابلیت یادگیری افزایشی
تکرار نام مولف :
محمدهادی قومنجانی
سال نشر :
1395
صفحه شمار:
60 ص
یادداشت
چکیده
داده جریانی یک دنباله از دادهها با ویژگیهای خاصی از جمله حجم زیاد و دسترسی تدریجی به دادههاست. در بسیاری از کاربردهای دادههای جریانی، دادههایی از یک نوع دسته و گروه موجود است، تشخیص دادههای غیر از این دسته یک فعالیت مهم در دادههای جریانی به شمار میرود. هنگامیکه دادههای یک دسته در دسترس هستند از طبقهبندی تککلاسه برای طبقهبندی دادهها استفاده میشود. وظیفه اصلی طبقهبندی تککلاسه جداسازی دادهها به دو بخش داده هدف و پرت است. دسترسی تدریجی به دادهها یا در دسترس نبودن تمام دادهها در یک زمان خاص، یک چالش مهم در طبقهبندی دادههای جریانی است. این مطلب به طور مستقیم تاثیر منفی بر صحت طبقهبندی دارد. در این پایاننامه برای بهبود صحت طبقهبندی دادههای جریانی ایستا، دو طبقهبند افزایشی پیشنهاد شده است. روش اول بر پایه الگوریتم پوسته محدب میباشد. این روش با وزندهی به نقاط پوسته محدب براساس تراکم، سعی در بهبود صحت طبقهبند دارد. ایده اصلی روش پیشنهادی دوم مبتنی بر طبقهبند رُبع کُره ماشین بردار پشتیبان است. این طبقهبند با تقسیم مسئله به دومسئله طبقهبندی با فضای نمونه کمتر، سعی در تشخیص مرز کلاس هدف را دارد. برای ارزیابی روشهای پیشنهادی، آزمایشهای متعددی بر روی مجموعه دادههای واقعی انجام شده است. نتایج حاصل از آزمایشها نشاندهنده عملکرد بهتر روش پیشنهادی دوم از نظر بهبود صحت طبقهبندی در مقایسه با الگوریتمهای مرز دانش است.