پیش پردازش داده های نا متوازن با استفاده از ماشین بردار پشتیبان
تعداد صفحات:113
چکیده
برای دست
یابی به نتایج مطلوب در داده کاوی نیاز به پیش پردازش داده ها داریم.پیش
پردازش داده ها یکی از اجزای مهم در فرایند کشف دانش است.روش های بسیاری
برای پیش پردازش داده وجود دارد که میتوان از آنها استفاده کرد.اما این
روش ها برای داده های نامتوازن مناسب نیستند. اصطلاح “مجموعه داده
نامتوازن” عموما به مجموعه دادهای گفته میشود که در آن تعداد نمونههایی
که نمایانگر یک کلاس هستند از نمونههای دیگر در کلاسهای متفاوت کمتر است
مشکل عدم توازن کلاس در بسیاری از برنامه های کاربردی جهان واقعی به رسمیت
شناخته شده است و موضوع تحقیقات یادگیری مبتنی بر ماشین قرار گرفته است از
این رو اخیراً مشکل نامتوازن بودن کلاسها مورد توجه محققان در زمینهی
دادهکاوی قرار گرفته است.آنها به دنبال کشف روش هایی بودند که با اعمال بر
روی داده های نامتوازن به نتایج مطلوبی دست یابند.
در این
پروژه روش های گوناگون پیش پردازش داده های نامتوازن مورد بحث قرار گرفته و
الگوریتم جدیدی برای بهبود نتایج طبقه بندی ارائه میشود، به گونه ای که
کارایی و دقت آن مورد توجه باشد.