طراحی و تحلیل طبقهبند موضوعی خودکار برای محتوای شبکههای اجتماعی با تمرکز بر سیل ۹۸ |
کد مقاله : 1034-AISCH (R1) |
نویسندگان |
محمد رهبری *1، زهرا رضوی2 1دانشکده حقوق و علوم سیاسی، دانشگاه علامه طباطبایی، تهران، ایران 2دانشکده علوم کامپیوتر دانشگاه راچستر، نیویورک، آمریکا |
چکیده مقاله |
با گسترش اینترنت و پیامرسانهای موبایلی در کشور، بسیاری از مردم روزانه از این پیامرسانها به منظور برقراری ارتباط با دیگران استفاده میکنند. از این طریق، روزانه حجم زیادی از دادههای ارتباطی مختلف در این شبکهها رد و بدل میشود که تحلیل آنها میتواند ابزاری برای نظرکاوی عمومی شده و جایگزین نظرسنجیهای سنتی گردد. در این مقاله دادههای شبکههای اجتماعی تلگرام و توئیتر در بازهی بحران سیل ۹۸ مورد مطالعه قرار گرفته است. این دادهها براساس محتوا برچسب زده شده و برای آموزش طبقهبند خودکار با استفاده از روشهای روزآمد در یادگیری ماشین مورد استفاده قرار میگیرد. همچنین نشان داده میشود که ابزار طبقهبندی متن fasttext در عین سادگی استفاده و عدم نیاز به دانش پیشزمینه طبقهبندی موضوعی را با سرعت و دقت قابل مقایسه با بهترین نتایج روشهای معرفی شده انجام میدهد و علاوه بر آن موجب بایاس معنیدار روی برچسبهای پیشبینی شده نمیگردد، لذا میتواند توسط پژوهشگران علوم انسانی مورد استفاده قرار گیرد. همچنین نتایج بدست آمده از دقت بالاتر طبقهبندی مطالب تلگرامی در مقایسه با توئیتر حکایت دارد. این نتایج از دو منظر طول دادههای این دو شبکه های اجتماعی و نیز الگوهای زبانی مورد استفاده در هرکدام مورد تحلیل قرار گرفته است. |
کلیدواژه ها |
دادهکاوی، تحلیل دادههای شبکههای اجتماعی، طبقهبندی موضوعی متن، سیل ایران، تحلیل تلگرام، تحلیل توئیتر |
وضعیت: پذیرفته شده |