در سالهای اخیر، وب سایتهای نشانهگذاری اجتماعی به اجزاء مهم در وب تبدیل شدهاند. با این حال، علیرغم موفقیت خود، با هجوم رو به رشد هرزنامه و هرزنامهنویسان مواجه بودهاند که اگر اقدامی برای کنترل هرزنامه و هرزنامهنویسان انجام نشود میتواند باعث تضعیف به اشتراکگذاری منابع، تعامل و آزادی در این سیستمها شود. هدف اصلی این رساله تشخیص پستهای هرز در سیستمهای نشانهگذاری اجتماعی است. بر این اساس ابتدا مسئله هرزنامه در سیستمهای نشانهگذاری اجتماعی بطور کامل شرح داده میشود. سپس با انتخاب و تمرکز بر روی یک سیستم نشانهگذاری، روشی برای تشخیص پستهای هرز ارائه میشود. روش پیشنهادی در دو گام پیش پردازش و طبقهبندی ارائه شده است. در گام پیش پردازش دادهها پالایش شده و ویژگی های جدید استخراج میشود. درگام پردازش با استفاده از یک طبقهبند دادهها به دو دسته هرزنامه و غیرهرزنامه طبقهبندی میشوند. در پایان روش پیشنهادی با دو روش دیگر مقایسه و ارزیابی میگردد. برای این منظور، آزمایشهای متعددی بر روی مجموعهدادههای واقعی انجام شده است. نتایج حاصل از آزمایشها نشاندهندهی افزایش دقت روش پیشنهادی در مقایسه با سایر الگوریتمهای تشخیص هرزنامه است.
واژههای کلیدی:
وب سایتهای اجتماعی، نشانهگذاری، وب سایت های نشانهگذاری اجتماعی، هرزنامه