طراحی و تحلیل طبقه‌بند موضوعی خودکار برای محتوای شبکه‌های اجتماعی با تمرکز بر سیل ۹۸
کد مقاله : 1034-AISCH (R1)
نویسندگان
محمد رهبری *1، زهرا رضوی2
1دانشکده حقوق و علوم سیاسی، دانشگاه علامه طباطبایی، تهران، ایران
2دانشکده علوم کامپیوتر دانشگاه راچستر، نیویورک، آمریکا
چکیده مقاله
با گسترش اینترنت و پیام‌رسان‌های موبایلی در کشور، بسیاری از مردم روزانه از این پیام‌رسان‌ها به منظور برقراری ارتباط با دیگران استفاده می‌کنند. از این طریق، روزانه حجم زیادی از داده‌های ارتباطی مختلف در این شبکه‌ها رد و بدل می‌شود که تحلیل آن‌ها می‌تواند ابزاری برای نظرکاوی عمومی شده و جایگزین نظرسنجی‌های سنتی گردد. در این مقاله داده‌های شبکه‌های اجتماعی تلگرام و توئیتر در بازه‌ی بحران سیل ۹۸ مورد مطالعه قرار گرفته است. این داده‌ها براساس محتوا برچسب زده شده و برای آموزش طبقه‌بند خودکار با استفاده از روش‌های روزآمد در یادگیری ماشین مورد استفاده قرار می‌گیرد. هم‌چنین نشان داده می‌شود که ابزار طبقه‌بندی متن fasttext در عین سادگی استفاده و عدم نیاز به دانش پیش‌زمینه طبقه‌بندی موضوعی را با سرعت و دقت قابل مقایسه با بهترین نتایج روش‌های معرفی شده انجام می‌دهد و علاوه بر آن موجب بایاس معنی‌دار روی برچسب‌های پیش‌بینی شده نمی‌گردد، لذا می‌تواند توسط پژوهشگران علوم انسانی مورد استفاده قرار گیرد. همچنین نتایج بدست آمده از دقت بالاتر طبقه‌بندی مطالب تلگرامی در مقایسه با توئیتر حکایت دارد. این نتایج از دو منظر طول داده‌های این دو شبکه های اجتماعی و نیز الگوهای زبانی مورد استفاده در هرکدام مورد تحلیل قرار گرفته است.
کلیدواژه ها
داده‌کاوی، تحلیل داده‌های شبکه‌های اجتماعی، طبقه‌بندی موضوعی متن، سیل ایران، تحلیل تلگرام، تحلیل توئیتر
وضعیت: پذیرفته شده
login