ترکیب طبقه بند بردار پشتیبان توصیف داده با طبقه بند کردال برای بهبود صحت در مقابل داده های دارای عدم قطعیت
تکرار نام مولف :
ندا نمایی قاسمی
سال نشر :
1396
صفحه شمار:
47ص
یادداشت
چکیده
یکی از اهداف اصلی علم دادهکاوی، جستجو و بررسی نوع خاصی از دادههامیباشد. برای جداسازی این نوع خاص از بقیهیدادهها، میتوان آنها را به دو دستهیدادههای مطلوب (هدف) و دادههای دیگر (دادههای پرت) تقسیم کرد. بررسی این دادهها و جداسازی آنها از هم مستلزم نوعی طبقهبندی داده است. طبقهبندی نیز به طور کلی به دو روش طبقهبندی سنتی و طبقهبندی تک کلاسه انجام میشود. بردار پشتیبان توصیف داده یک طبقهبندتککلاسه مبتنی بر بردار پشتیبان در یادگیری ماشینی است که هدف آن پیدا کردن مرزی در اطراف داده¬های هدف است به طوری که بیشترین تعداد داده¬های هدف را در برگرفته و کمترین میزان داده¬های پرت را شامل شود. اما وجود دادههای دارای عدم قطعیت در اطراف مرز این طبقهبند، طبقهبندی را با چالش مواجهه میکند.
یکی از ابزارهای مواجهه با عدم قطعیت استفاده از تئوری توابع باور است. یکی از طبقهبندهای کارا که با استفاده از این تئوری عمل میکند، طبقهبندکردال است. از این رو در این پایاننامهبرآنیم تا با ترکیب دو طبقهبندکردال و بردار پشتیبان توصیف داده، روشی برای مقاومسازیطبقهبند و بهبود صحت آن در مقابل دادههای دارای عدم قطعیت ارائه کنیم. برای ارزیابی روش پیشنهادی، آزمایشهای متعددی بر روی مجموعه دادههای واقعی انجام شده است. نتایج حاصل از آزمایشهانشاندهنده عملکرد بهتر این روش، از نظر میزان صحت در مقایسه با روشهای دیگر است.
واژههای کلیدی:بردار پشتیبان توصیف داده، طبقهبند کردال، تئوری توابع باور، عدم قطعیت