تعداد نشریات | 38 |
تعداد شمارهها | 1,240 |
تعداد مقالات | 8,992 |
تعداد مشاهده مقاله | 7,843,136 |
تعداد دریافت فایل اصل مقاله | 4,704,895 |
مدیریت مستندات محتوای فارسی رسانه های آنلاین خبری در جامعه اطلاعاتی | ||
فصلنامه پژوهش های حفاظتی امنیتی | ||
دوره 12، شماره 45، تیر 1402، صفحه 167-190 اصل مقاله (3.62 M) | ||
نوع مقاله: مقاله پژوهشی | ||
نویسندگان | ||
حمید میرزائی دهنوی1؛ محمد علی کرامتی* 2؛ محمدعلی عامری حبیب آبادی3 | ||
1گروه مدیریت فناوری اطلاعات، واحد تهران مرکزی، دانشگاه آزاد اسلامی | ||
2گروه مدیریت صنعتی، واحد تهران مرکزی، دانشگاه آزاد اسلامی، تهران، ایران.(نویسنده مسئول) | ||
3گروه مدیریت، پژوهشگاه علوم انتظامی و مطالعات اجتماعی، تهران، ایران. | ||
تاریخ دریافت: 15 بهمن 1401، تاریخ بازنگری: 31 فروردین 1402، تاریخ پذیرش: 21 اردیبهشت 1402 | ||
چکیده | ||
عصری که ما در آن زندگی میکنیم، عصر اطلاعات است و برای سازمان ها مهمترین مسئله، اشراف بر همین اطلاعات است. با رشد روزافزون اخبار در دنیای دیجیتال و اینترنت، موضوعی که مهم و حائز اهمیت میشود، دستهبندی این اطلاعات و دسترسی سریع و ارزان ما به آنها میباشد. این مهم به دست نمیآید مگر با انجام روشهایی که از آن بهعنوان دستهبندی متون یاد شده است. هدف این پژوهش دستهبندی متون خبری در دستههای از قبل مشخصشده می باشد که با استفاده از ابزار مدل اتوماتیک که یکی از زیرمجموعههای متنکاوی محسوب میشود صورت می پذیرد. با توجه به اهمیت موضوع و کاری که در این زمینه برای زبانهای دیگر دنیا انجام گرفته است، نیاز به طبقهبندی متون فارسی به خوبی احساس میشود. این نکته قابل توجه می باشد که تحقیقات برای متون انگلیسی توسعه داده شده و به کارگرفته می شود اما از آنجاییکه زبان فارسی پیچیدگی های ساختاری نسبت به سایر زبان ها دارد و همچنین تحقیقات کمتری در این زمینه انجام گرفته است، این پژوهش از نوع کاربردی، توسعه ای می باشد که برای انجام آن می توان به روش پژوهش آزمایشی و استفاده از ابزار متن کاوی اشاره کرد، به این صورت که در یک محیط کاملاً تحت کنترل و با توانایی ثابت نگه داشتن سایر متغیرها انجام می گردد. در جامعه اطلاعاتی دستهبندی متون بهوسیله افراد نخبه و بهصورت دستی انجام میگیرد. دستهبندی متون آنهم با این حجم و بهصورت دستی غیرممکن به نظر میرسد، بنابراین ما ناگزیریم که به دنبال روشهایی برای دستهبندی خودکار متون باشیم. از سوی دیگر ذخیرهسازی، پردازش و تحلیل این حجم از اطلاعات تبدیل به چالشی جدی شده است. با توجه به حجم بالای اخبار، داده ها، اطلاعات، اسناد و پیچیدگی حفظ و نگهداری آنها، لازم است سیستمی جهت مدیریت دریافت، حفظ و نگهداری اخبار موجود، بکار گرفته شود. پیچیدگی سازمان ها نیاز به متمرکز بودن اخبار، اسناد، طبقه بندی درست، گردش صحیح اخبار و سهولت در دسترسی به آنها را ایجاد می نماید. مدیریت مستندات این امکان را برای سازمان های اطلاعاتی فراهم می آورد که اخبار و اسناد دریافتی یا موجود را به درستی طبقه بندی نموده، آنها را حفظ، نگهداری و بازیابی نماید. با بررسی، تحلیل و پردازش در این پژوهش به این نتیجه می رسیم که دقت و نتایج حاصل روش پیشنهادی روی متون خبری برخط نشان میدهد؛ مدل ماشین بردار پشتیبان دارای دقت 29/93، صحت 32/93، فراخوانی 96/92 و خطای 71/6 است. | ||
کلیدواژهها | ||
طبقه بندی؛ مدیریت مستندات؛ محتوای فارسی؛ متن کاوی؛ اطلاعات و دسته بندی | ||
عنوان مقاله [English] | ||
Management of Farsi Content Documentation of Online News Media in the Intelligence Society | ||
نویسندگان [English] | ||
Hamid Mirzaei Dehnavi1؛ Mohammad Ali Karamati2؛ Mohammad Ali Ameri Habibabadi3 | ||
1Department of Information Technology Management, Tehran Center Branch, Islamic Azad University, , | ||
2Department of Industrial Management, Tehran Center Branch, Islamic Azad University, Tehran, Iran. (Corresponding author) | ||
3Department of Management, Research Institute of Law Enforcement Sciences and Social Studies, Tehran, Iran | ||
چکیده [English] | ||
The age we live in is the age of information, and the most important issue for organizations is the mastery of this information. With the ever-increasing growth of news in the digital world and the Internet, the issue that becomes important is the classification of this information and our quick and cheap access to it. This importance cannot be achieved except by doing the methods referred to as text classification. The purpose of this research is to classify news texts into predefined categories, which is done using the automatic model tool, which is considered one of the subsets of text mining. Considering the importance of the subject and the work that has been done in this field for other languages of the world, the need to classify Persian texts is well felt. It is noteworthy that research has been developed and used for English texts, but since the Persian language has structural complexities compared to other languages and also less research has been done in this field, this research is of an applied type. It is a development that can be done using the experimental research method and the use of text mining tools, as it is done in a completely controlled environment with the ability to keep other variables constant. In the intelligence society, the classification of texts is done manually by elite people. It seems impossible to categorize texts with this volume manually, so we are forced to look for methods to automatically categorize texts. On the other hand, storing, processing and analyzing this amount of information has become a serious challenge. Due to the high volume of news, data, information, documents and the complexity of maintaining and maintaining them, it is necessary to use a system to manage receiving, maintaining and maintaining existing news. The complexity of organizations creates the need for centralization of news, documents, correct classification, correct circulation of news and ease of access to them. Document management provides the possibility for information organizations to correctly classify received or existing news and documents, preserve, maintain and retrieve them. By examining, analyzing and processing in this research, we come to the conclusion that the accuracy and results of the proposed method on online news texts show; The support vector machine model has 93.29 precision, 93.32 accuracy, 92.96 recall, and 6.71 error. | ||
کلیدواژهها [English] | ||
Classification, Document Management, Information and Classification, Persian Content, Text Mining | ||
مراجع | ||
categorization.
4(7), 2101-2104.
| ||
آمار تعداد مشاهده مقاله: 94 تعداد دریافت فایل اصل مقاله: 151 |