مروری بر چالش ها و الگوریتم های تشخیص ناهنجاری در کلان داده ها |
کد مقاله : 1052-AISCH (R1) |
نویسندگان |
سید محمد مهدی بهادرنیا *، فاطمه چلونگر مدیریت فناوری اطلاعات، دانشکده مدیریت، دانشگاه علامه طباطبایی، تهران، ایران |
چکیده مقاله |
در سال های اخیر با پیشرفت فناوری هم در عرصه ی سخت افزار و هم نرم افزار، پیدایش بستر مناسب برای اینترنت اشیاء و سنسورهای همراه و تولید لحظه ای و سریع داده ها موجب پیدایش زمینه ی جدیدی به نام کلان داده ها شد. این عرصه علاوه بر فوایدی که با خود به همراه دارد، با چالش هایی بسیار جدی نیز مواجه است که شاید مهمترین آن را بتوان رفتارهای غیر عادی در داده ها دانست که سر منشا بسیاری از تهدیدهای امنیتی می تواند باشد. بنابراین تشخیص ناهنجاری ها در کلان داده ها از منظر متخصصان امر دارای اهمیت فزاینده ای است. از این روی، به منظور مواجهه با این مسائل شاهد تقاطع مباحث مرتبط به کلان داده ها و یادگیری ماشینی، به جهت کشف ناهنجاری ها، هستیم. در بخشی از این کار پژوهشی به مرور و ارزیابی الگوریتم های مورد استفاده برای تشخیص ناهنجاری در کلان داده ها پرداخته می شود. از طرفی دیگر، به سه چالش مهمِ این زمینه (افزونگی داده ها، هزینه ی محاسبات و انتخاب پارامترهای الگوریتم) اشاره می شود. همچنین، به راه های فائق آمدن بر این چالش ها که در ادبیات موضوع بدان اشاره شده است نیز توجه شده است. |
کلیدواژه ها |
تشخیص ناهنجاری، کلان داده ها، یادگیری ماشینی، افزونگی داده ها، هزینه محاسبات، انتخاب پارامترهای الگوریتم |
وضعیت: پذیرفته شده |