استخراج اطلاعات تهدیدات سایبری با استفاده از یادگیری عمیق و بازنمایش دانش

حورعلی, سمیرا; حورعلی, فاطمه; پاکزاد, عاطفه

فراخوان حمایت از طرحهای فناورانه: جوش اتوماتیک به کمک ربات پرتابل

تعداد نشریات	34
تعداد شماره‌ها	1,338
تعداد مقالات	9,662
تعداد مشاهده مقاله	9,926,012
تعداد دریافت فایل اصل مقاله	6,115,999

	استخراج اطلاعات تهدیدات سایبری با استفاده از یادگیری عمیق و بازنمایش دانش
پدافند الکترونیکی و سایبری
مقاله 7، دوره 13، شماره 2 - شماره پیاپی 50، تیر 1404
نوع مقاله: مقاله پژوهشی
نویسندگان
سمیرا حورعلی^* ¹؛ فاطمه حورعلی²؛ عاطفه پاکزاد¹
¹استادیار گروه مهندسی کامپیوتر، دانشکده فنی مهندسی و علوم پایه، دانشگاه کوثر بجنورد، بجنورد، ایران
²استادیار گروه مهندسی برق، دانشکده مهندسی برق و کامپیوتر، مجتمع آموزش عالی فنی و مهندسی اسفراین، اسفراین، ایران
تاریخ دریافت: 27 فروردین 1404، تاریخ بازنگری: 04 خرداد 1404، تاریخ پذیرش: 26 خرداد 1404
چکیده
اطلاعات مربوط به امنیت سایبری به سرعت در اینترنت در حال رشد است و حملات سایبری روز به روز در حال افزایش است. مهاجمان بیشتر بخش‌های نظامی، دولتی و شرکتی را هدف قرار می‌دهند، زیرا این بخش‌ها حاوی اطلاعات حساس و طبقه‌بندی‌شده‌ای هستند که به استراتژی‌های دفاعی مناسب نیاز دارد. استخراج اطلاعات تهدیدات سایبری یعنی استخراج نهادها، روابط بین آن‌ها و رویدادهای موجود در متون سایبری، یکی از گام‌های مهم برای تشخیص حملات سایبری، رویدادهای مضر و کاهش آنها در زمان واقعی در صورت وقوع است. استخراج مؤثر اطلاعات ارزشمند از تهدیدات سایبری می‌تواند به متخصصان امنیتی در تصمیم‌گیری آگاهانه و توسعه استراتژیهای دفاعی قوی کمک کند .همچنین این موضوع یکی از راهکارهای اساسی برای ارتقاء عملکرد سیستم‌هایی نظیرخلاصه‌سازی متون، ترجمه ماشینی و پرسش و پاسخ نیز می‌باشد. هرچند طی چهار دهه گذشته استخراج اطلاعات همواره یک موضوع تحقیقاتی فعال بوده است؛ اما هنوز هم دقت آن در حد قابل قبول نیست و مدل محاسباتی دقیقی برای آن وجود ندارد. در این مقاله ابتدا توسط جدیدترین متد تعبیه واژگان، شبکه بازگشتی دوجهته Bi-GRU، مکانیزم توجه و بازنمایش دانش نهادهای موجود در متن با دقت بالا استخراج می‌شوند؛ سپس با محاسبه میزان اهمیت و وزن هر ویژگی و در نظر گرفتن تمام معیارهای لازم در تصمیم-گیری، عبارات وابسته به نهادها تشخیص داده می‌شود. جهت استخراج دقیق روابط بین نهادها از شبکه‌ عصبی مبتنی بر گراف و تابع هزینه ابتکاری استفاده شده است. برای تشخیص و پیش‌بینی دقیق رویدادهای امنیتی از شبکه عمیق KVP مبتنی بر مکانیزم توجه استفاده شده است که می‌تواند همبستگی بین دو عنصر که موقعیت‌های متفاوتی در یک دنباله ورودی دارند را شناسایی کند. برای بررسی عملکرد روش پیشنهادی شبیه‌سازی‌های گسترده‌ای صورت گرفته است. طبق نتایج شبیه‌سازی، روش پیشنهادی روی پیکره-های CoNLL-2012 و OSINT به ترتیب به امتیاز F1 8/89 و 4/93 درصد دست یافته است.
کلیدواژه‌ها
استخراج اطلاعات؛ تهدیدات سایبری؛ روابط نهادها؛ استخراج رویداد؛ یادگیری عمیق؛ بازنمایش دانش
موضوعات
آسیب پذیری ها و تهدیدات فضای سایبری
عنوان مقاله [English]
Cyber Threat Information Extraction using Deep Learning and Knowledge Representation
نویسندگان [English]
Samira Hourali¹؛ Fatemeh Hourali²؛ Atefe Pakzad¹
¹Assistant Professor, Department of Computer Engineering, Faculty of Engineering, Kosar University of Bojnord, Bojnord, Iran
²Assistant Professor, Department of Electrical Engineering, Faculty of Electrical and Computer Engineering, Esfarayen University of Technology, Esfarayen, Iran
چکیده [English]
Cyber security information is rapidly growing on the internet and cyber attacks are increasing daily. Attackers mostly target the military, government, and corporate departments, because these contain sensitive and classified information that requires appropriate defense strategies. Cyber threat information extraction, i.e., extracting entities, relationships between them, and events in cyber texts, is one of the important steps for detecting cyber attacks, harmful events, and mitigating them in real time if they occur. Extracting valuable information from cyber threats can help security professionals to make informed decisions and develop strong defense strategies. It is also a fundamental solution for improving the performance of systems such as text summarization, machine translation, and question-answering. Although information extraction has been an active research topic over the past four decades, its accuracy is still not acceptable and there is no accurate computational model for it. In this paper, first, the entities in the text are extracted with high accuracy using the latest vocabulary embedding method, the Bi-GRU bidirectional recurrent network, the attention mechanism, and the knowledge representation; Then, expressions related to the entities are recognized by calculating the importance and weight of each feature and considering all the necessary criteria in decision-making. The entities relationships were extracted by a graph-based neural network and a heuristic loss function. The KVP deep network based on the attention mechanism has been used for accurate detection and security events prediction which can identify the correlation between two elements that have different positions in the input sequence. Extensive simulations have been carried out to check the performance of the proposed method. According to the simulation results, the proposed method has achieved 89.8% and 93.4% F1 scores on CoNLL-2012 and OSINT datasets, respectively.
کلیدواژه‌ها [English]
Information extraction, cyber threats, entity relationships, event extraction, deep learning, knowledge representation

مراجع

آمار تعداد مشاهده مقاله: 188

اخبار و اعلانات

آمار

استخراج اطلاعات تهدیدات سایبری با استفاده از یادگیری عمیق و بازنمایش دانش