Mirzaei Dehnavi, H., Karamati, M., Ameri Habibabadi, M. (2023). Management of Farsi Content Documentation of Online News Media in the Intelligence Society. Electronic and Cyber Defense, 12(45), 167-190.
Hamid Mirzaei Dehnavi; Mohammad Ali Karamati; Mohammad Ali Ameri Habibabadi. "Management of Farsi Content Documentation of Online News Media in the Intelligence Society". Electronic and Cyber Defense, 12, 45, 2023, 167-190.
Mirzaei Dehnavi, H., Karamati, M., Ameri Habibabadi, M. (2023). 'Management of Farsi Content Documentation of Online News Media in the Intelligence Society', Electronic and Cyber Defense, 12(45), pp. 167-190.
Mirzaei Dehnavi, H., Karamati, M., Ameri Habibabadi, M. Management of Farsi Content Documentation of Online News Media in the Intelligence Society. Electronic and Cyber Defense, 2023; 12(45): 167-190.
Management of Farsi Content Documentation of Online News Media in the Intelligence Society
1Department of Information Technology Management, Tehran Center Branch, Islamic Azad University, ,
2Department of Industrial Management, Tehran Center Branch, Islamic Azad University, Tehran, Iran. (Corresponding author)
3Department of Management, Research Institute of Law Enforcement Sciences and Social Studies, Tehran, Iran
Receive Date: 04 February 2023,
Revise Date: 20 April 2023,
Accept Date: 11 May 2023
Abstract
The age we live in is the age of information, and the most important issue for organizations is the mastery of this information. With the ever-increasing growth of news in the digital world and the Internet, the issue that becomes important is the classification of this information and our quick and cheap access to it. This importance cannot be achieved except by doing the methods referred to as text classification. The purpose of this research is to classify news texts into predefined categories, which is done using the automatic model tool, which is considered one of the subsets of text mining. Considering the importance of the subject and the work that has been done in this field for other languages of the world, the need to classify Persian texts is well felt. It is noteworthy that research has been developed and used for English texts, but since the Persian language has structural complexities compared to other languages and also less research has been done in this field, this research is of an applied type. It is a development that can be done using the experimental research method and the use of text mining tools, as it is done in a completely controlled environment with the ability to keep other variables constant. In the intelligence society, the classification of texts is done manually by elite people. It seems impossible to categorize texts with this volume manually, so we are forced to look for methods to automatically categorize texts. On the other hand, storing, processing and analyzing this amount of information has become a serious challenge. Due to the high volume of news, data, information, documents and the complexity of maintaining and maintaining them, it is necessary to use a system to manage receiving, maintaining and maintaining existing news. The complexity of organizations creates the need for centralization of news, documents, correct classification, correct circulation of news and ease of access to them. Document management provides the possibility for information organizations to correctly classify received or existing news and documents, preserve, maintain and retrieve them. By examining, analyzing and processing in this research, we come to the conclusion that the accuracy and results of the proposed method on online news texts show; The support vector machine model has 93.29 precision, 93.32 accuracy, 92.96 recall, and 6.71 error.
باقری، ایوب؛ فرزانه فر، حامد؛ سرایی، محمدحسین و احمدزاده، محمدرضا (1387). دستهبندی متون خبری فارسی با استفاده از الگوریتم بیز ساده، دومین کنفرانس دادهکاوی ایران، تهران،https://civilica.com/doc/70524
برفامی، مهدی و فاطری، سهیل (1392). استفاده از ترکیب شبکههای عصبی جهت دستهبندی متون فارسی مبتنی بر الگوریتمهای GA، کی-نزدیکترین همسایه، PCA جهت کاهش ویژگی، اولین همایش ملی رویکردهای نوین در مهندسی کامپیوتر و بازیابی اطلاعات، رشت، https://civilica.com/doc/225887
بصیری، محمد احسان؛ نعمتی، شهلا و قاسم آقایی، ناصر (1386). مقایسه دستهبندی متون فارسی با استفاده از الگوریتمهای کی-نزدیکترین همسایه و fkNN و انتخاب ویژگیها بر اساس بهره اطلاعات و فرکانس سند، سیزدهمین کنفرانس سالانه انجمن کامپیوتر ایران، جزیره کیش، https://civilica.com/doc/41786
بینا، بهاره؛ رهگذر، مسعود و ده موبد، آذین (١٣٨٦). طبقهبندی خودکار متون فارسی سیزدهمین کنفرانس سالانه انجمن کامپیوتر ایران، جزیره کیش، انجمن کامپیوتر، دانشگاه صنعتی شریف.
حسنپور، حمید؛ قنبری سرخی، علی و پارسی، اشکان (1391). استخراج بهترین ویژگی از متون فارسی با استفاده از تجزیهوتحلیل مؤلفههای اصلی با کمک میانگین یادآوری و الگوریتم ژنتیک، نخستین کنفرانس بینالمللی پردازش خط و زبان فارسی.
حسنپور، حمید و مدنی، صبا سادات (1393). بهبود دقت سیستم دستهبندی خودکار اسناد فارسی به کمک هستانشناسی فارسنت، مجلهی علمی پژوهشی، رایانش نرم و فناوری اطلاعات، جلد 3، شماره 1
زمانی، محسن؛ دیانت، روحالله و صادق زاده، مهدی (1392). دستهبندی متون فارسی با استفاده از روش آنالیز معنایی پنهان احتمالاتی، همایش ملی کاربرد سیستمهای هوشمند (محاسبات نرم) در علوم و صنایع، قوچان،https://civilica.com/doc/206251
طاهری نیا، محسن (1391). دستهبندی متون فارسی با استفاده از یادگیری نیمه نظارتشده، چهارمین کنفرانس مهندسی برق و الکترونیک ایران، گناباد،https://civilica.com/doc/164226
عابدینی نیا، مائده؛ الله دادی، لاله و شیخی، فاطمه (1392). کاوش متون فارسی در وب با استفاده از تحلیل معنایی و روش طبقهبندی چندلایهای اطلاعات، اولین همایش ملی رویکردهای نوین در مهندسی کامپیوتر و بازیابی اطلاعات، رشت،https://civilica.com/doc/225377
عربی نرئی، سمیه؛ وحیدی اصل، مجتبی و مینایی بیدگلی، بهروز (1386). استخراج کلمات کلیدی جهت طبقهبندی متون فارسی، اولین کنفرانس دادهکاوی ایران، تهران، https://civilica.com/doc/33094
قنبری سرخی، علی و ابراهیمی، فاطمه (1390). بهبود عملکرد طبقهبندی متون فارسی با استفاده از تجزیهوتحلیل مؤلفههای اصلی با کمک معیار میانگین یادآوری و دقت، چهاردهمین کنفرانس دانشجویی مهندسی برق کشور، کرمانشاه،https://civilica.com/doc/121558
مقصودی، نوشین و همایونپور، محمدمهدی (1388). ارائه روشی جدید در طبقهبندی متون فارسی با استفاده از دانش معنایی "، پانزدهمین کنفرانس بینالمللی سالانه انجمن کامپیوتر ایران.
آقا کاردان، احمد و کیهانی نژاد، مینا (١٣٩١). ارائه مدلی برای استخراج اطلاعات از مستندات متنی، مبتنی بر متنکاوی در حوزه یادگیری الکترونیکی. فصلنامه علمی-پژوهشی فناوری اطلاعات و ارتباطات ایران، سال چهارم، شمارههای ١١ و ١٢، ص ٤٧ تا ٥٤
بازقندی، مهدی؛ تدین تبریزی، قمرناز و وفایی جهان، مجید (١٣٩١). نخستین کنفرانس بینالمللی پردازش خط و زبان طبیعی، دانشگاه سمنان.
بهرام پور، اکبر؛ بهشتی، همایون و لاکتراشی، طیبه (1394). بررسی روشها و الگوریتمهای دستهبندی اخبار با استفاده از پردازش زبان طبیعی (NLP)، دومین کنفرانس ملی توسعه علوم مهندسی، تنکابن، موسسه آموزش عالی آیندگان.
پرئی، اعظمالسادات و حمیدی، حجت اله (١٣٩٥). ارائه رویکردی برای مدیریت و سازماندهی اسناد متنی با استفاده از تجزیه تحلیل هوشمند متن. فصلنامه علمی- پژوهشی پژوهشگاه علوم و فناوری اطلاعات ایران، دوره ٣٢، شماره٤، ص١١٧١ تا ١٢٠٢
جمالی، ایمان؛ میرعابدینی، سید جواد و هارونآبادی، علی (١٣٩٦). ارائهی یک مدل جهت دستهبندی متون فارسی با استفاده از ترکیب روشهای دستهبندی، مجله مهندسی مخابرات، سال هفتم، شماره ٢٣
سیاحی، عارف؛ هاشمی، سید محسن و مزرعه، سعید (١٣٩٤). بهبود یک روش مبتنی بر انتخاب ویژگی بهمنظور دستهبندی متون با الگوریتمهای متنکاوی، دومین کنگره سراسری فناوریهای نوین ایران با هدف دستیابی به توسعه پایدار، تهران، مرکز راهکارهای دستیابی به توسعه پایدار، موسسه آموزش عالی مهر اروند.
شیخی، مریم؛ اکبرپور، شاهین و فرزان، علی (١٣٩١). متنکاوی متون فارسی در راستای طبقهبندی آن. چهارمین کنفرانس مهندسی برق و الکترونیکی ایران.
کریمی منش، مصطفی و شیرازی، حسین (١٣٩٢). مقایسه روشهای وزندهی ویژگی در فرایند طبقهبندی مستندات. اولین کنفرانس ملی رویکردهای نوین در مهندسی کامپیوتر و بازیابی اطلاعات ایران
هاشمی، سید محسن (١٣٩٤). بهبود دستهبندی متون فارسی با ترکی روش دو مرحلهای انتخاب ویژگی و الگوریتمهای یادگیری ماشین، کنفرانس بینالمللی یافتههای نوین پژوهشی در مهندسی برق و علوم کامپیوتر، تهران، موسسه آموزش عالی نیکان.
BolshaKov, I. A. & GelbuKh, A. (2004). Computational linguistics: models, resources, applications: Instituto Politecnico Nacional.
Eyheramendy, S. GenKin, A. Ju,W.H. Lewis, D. D. & Madigan, D. (2003). Sparse bayesian classifiers for text categorization. Journal of Intelligence Community Research and Development, 13.
Francis, L. A. (2006). Taming Text: An Introduction to Text Mining. Paper presented at the Casualty Actuarial Society Forum
McCallum, A. & Nigam, K. (1998). A comparison of event models for naive bayes text classification. Paper presented at the AAAI-98 worKshop on learning for text
categorization.
Moulinier, I. & Ganascia, J. G. (1995). Applying an existing machine learning algorithm to text categorization. Paper presented at the International Joint Conference on Artificial Intelligence.
P. MulaK, &N. Talhar (2015). Analysis of distance measures using K-nearest neighbor algorithm on KDD dataset. International Journal of Science and Research,
4(7), 2101-2104.
NadKarni, P. M. Ohno-Machado, L. & Chapman, W. W. (2011). Natural language processing: an introduction. Journal of the American Medical Informatics Association, 18(5), 544-551.