مروری بر چالش ‏ها و الگوریتم ‏های تشخیص ناهنجاری در کلان داده ‏ها
کد مقاله : 1052-AISCH (R1)
نویسندگان
سید محمد مهدی بهادرنیا *، فاطمه چلونگر
مدیریت فناوری اطلاعات، دانشکده مدیریت، دانشگاه علامه طباطبایی، تهران، ایران
چکیده مقاله
در سال‏ های اخیر با پیشرفت فناوری هم در عرصه‏ ی سخت افزار و هم نرم افزار، پیدایش بستر مناسب برای اینترنت اشیاء و سنسورهای همراه و تولید لحظه ‏ای و سریع داده ‏ها موجب پیدایش زمینه ‏ی جدیدی به نام کلان داده ‏ها شد. این عرصه علاوه بر فوایدی که با خود به همراه دارد، با چالش‏ هایی بسیار جدی نیز مواجه است که شاید مهم‏ترین آن را بتوان رفتارهای غیر عادی در داده ‏ها دانست که سر منشا بسیاری از تهدیدهای امنیتی می ‏تواند باشد. بنابراین تشخیص ناهنجاری ‏ها در کلان داده ‏ها از منظر متخصصان امر دارای اهمیت فزاینده‏ ای است. از این روی، به منظور مواجهه با این مسائل شاهد تقاطع مباحث مرتبط به کلان داده ‏ها و یادگیری ماشینی، به جهت کشف ناهنجاری ‏ها، هستیم. در بخشی از این کار پژوهشی به مرور و ارزیابی الگوریتم ‏های مورد استفاده برای تشخیص ناهنجاری در کلان داده ‏ها پرداخته می ‏شود. از طرفی دیگر، به سه چالش مهمِ این زمینه (افزونگی داده ‏ها، هزینه ‏ی محاسبات و انتخاب پارامترهای الگوریتم) اشاره می ‏شود. همچنین، به راه‏ های فائق آمدن بر این چالش ‏ها که در ادبیات موضوع بدان اشاره شده است نیز توجه شده است.
کلیدواژه ها
تشخیص ناهنجاری، کلان داده ‏ها، یادگیری ماشینی، افزونگی داده ‏ها، هزینه محاسبات، انتخاب پارامترهای الگوریتم
وضعیت: پذیرفته شده
login