انتخاب ویژگی با استفاده از الگوریتم فاخته بهبود یافته
تکرار نام مولف :
مهسا کلیدری
سال نشر :
1398
صفحه شمار:
54ص
یادداشت
چکیده
انتخاب ویژگی نقش بسیار مهمی در داده هایی با ابعاد بالا دارد و به همین دلیل در سال های اخیر بسیار مورد توجه واقع شده است. یکی از کارهای بسیار مهم در داده کاوی و یادگیری ماشین کشف مرتبط ترین و مهم ترین ویژگی ها برای طبقه بندی است. در تمام دادگان ها ویژگی هایی نامرتبط به حل مساله وجود دارد که نرخ صحت و همچنین سرعت طبقه بند را تحت تاثیر قرار دهد. انتخاب ویژگی یک مساله بهینه سازی است که هدف آن بهبود نرخ صحت در طبقه بندی داده ها با بیشترین حذف داده نامرتبط است. مهمترین مساله ای که الگوریتم های انتخاب ویژگی با آن روبه رو هستند تصمیم گیری در این مورد است که کدام ویژگی باید در طبقه بندی شرکت کند. استفاده از تعداد زیاد ویژگی نیازمند حافظه زیاد است و از طرف دیگر سرعت اجرا را کاهش می دهد. پیچیدگی ابعاد مساله موجب ناکارآمدی الگوریتم های سنتی شده است و الگوریتم های تکاملی برای بهبود حل مساله مورد استفاده واقع شده اند. در این پژوهش با آشوبی کردن توام با استفاده از پرواز لوی در الگوریتم فاخته به الگوریتم فاخته بهبودیافته دست پیدا نموده تا بتوان به زیرمجموعه بهینه از ویژگی ها دست یافت. در الگوریتم فاخته بهبود یافته با کاهش میزان تصادفی بودن ویژگی های انتخاب شده و دوری از گیر کردن درپاسخ های بهینه محلی می توان به زیرمجموعه ویژگی مفیدتر و بهتری دست یافت. برای اثبات تاثیرگذاری و کارایی الگوریتم پیشنهادی، آزمایشات بر روی 15 دادگان دنیای واقعی انجام شده است. آزمایشات در حوزه نرخ صحت طبقه بند، نرخ کاهش ویژگی و میزان زمان مصرفی پردازنده انجام گردید و نتایج حاصل از آزمایشات برتری الگوریتم فاخته بهبودیافته را در میزان نرخ صحت، مقابل پنج الگوریتم مرز دانش شامل الگوریتم های جست وجوی کلاغ، وال، ازدحام ذرات، دسته گرگ خاکستری و فاخته را نشان می دهد. این نتایج، توانایی الگوریتم فاخته بهبودیافته را در انتخاب مرتبط ترین ویژگی ها و کاهش ویژگی معقول برای طبقه بندی نشان می دهد. همچنین با افزودن نویز به دادگان، آزمایشات نشان داد که الگوریتم فاخته بهبود یافته در مقابل سایر الگوریتم ها، با حضور ویژگی های نویزی، کمتر تحت تاثیر قرار می گیرد و نتایج معقول تر و بهتری در مواجهه با نویز دارد و نرخ صحت طبقه بندی تاثیر جدی در برابر نویز پیدا نمی کند