تعداد نشریات | 38 |
تعداد شمارهها | 1,244 |
تعداد مقالات | 9,010 |
تعداد مشاهده مقاله | 7,870,845 |
تعداد دریافت فایل اصل مقاله | 4,720,735 |
ارائه راهکاری برای پیش بینی شرکت های متقلب مالیاتی مبتنی بر الگوریتم های داده کاوی درخت تصمیم بهینه شده، ماشین بردار پشتیبان و شبکه بیزین | ||
مجله نوآوری های فناوری اطلاعات و ارتباطات کاربردی | ||
مقاله 2، دوره 2، شماره 2، اسفند 1400، صفحه 15-32 اصل مقاله (1.6 M) | ||
نوع مقاله: مقاله پژوهشی | ||
نویسندگان | ||
امین قمری مقدم* 1؛ حبیب اله نخعی2 | ||
1دانشجوی دکتری، رشته حسابداری، دانشگاه ازاد اسلامی واحد قائنات | ||
2استادیار گروه حسابداری دانشگاه آزاد اسلامی واحد بیرجند | ||
تاریخ دریافت: 29 آبان 1400، تاریخ بازنگری: 04 دی 1400، تاریخ پذیرش: 28 بهمن 1400 | ||
چکیده | ||
بسیاری از شرکتها با تخلف در صورتهای مالی موجب بههمریختگی نظام اقتصادی میشوند و این امر موجب یک بحران مهم نظام اقتصادی شده است. راهکارهای مختلفی برای تشخیص وجود دارد که اکثراً انسانی میباشند. این راهکارها دارای هزینههای بالایی برای محاسبه و بررسی صورتهای مالی تمامی شرکتها دارند ازاینجهت باید به دنبال راهکاری بود که بتواند با استفاده از دادهکاوی و خودکار این فرآیند تشخیص را انجام دهد. البته روشهای دادهکاوی نیز برای این قضیه ارائهشدهاند که هر یک دارای مزایا و معایبی میباشند. روشهای دادهکاوی که تا به اینجا برای این کار ارائه شدند دارای سربار بالای محاسباتی و یا دقت پایین بودند. حالآنکه در روش پیشنهادشده در این تحقیق از درخت تصمیمگیری ID3 بهبودیافته به همراه شبکه بیزین و ماشین بردار پشتیبان بهعنوان یک روش ترکیبی استفادهشده است. در این روش پیشنهادی برای بهبود عملکرد و دقت از الگوریتم مجموعه راف و تحلیل سلسله مراتبی در جهت انتخاب ویژگیهای مؤثر کمک گرفتهشده است. درختی که در روش پیشنهادی ایجاد میشود دارای کمترین عمق ممکن است و ازاینرو دارای سرعت بالایی است. سربار محاسباتی روش پیشنهادی به دلیل استفاده از الگوریتمی بهینه پایین میباشد. دادههای استفادهشده در ارزیابی دادههای مربوط به 3 سال از 60 شرکت است. در ارزیابی روش پیشنهادی نشان دادهشده است که روش پیشنهادی دارای دقت 80 درصد میباشد که نسبت به روشهای مشابه به خود دقت بالایی به حساب میآید. سربار زمانی در روش پیشنهادی O(m.n) و سربار حافظه O(n) است که m، نشاندهنده اندازه مجموعه آموزش و n نشاندهنده مجموعه ویژگی مورد استفاده در آموزش میباشد. | ||
کلیدواژهها | ||
شبکه بیزین؛ ماشین بردار پشتیبان؛ درخت تصمیم؛ فازی راف؛ تحلیل سلسله مراتبی؛ تقلب | ||
عنوان مقاله [English] | ||
Providing a solution for predicting tax fraud companies based on optimized decision tree, support vector machine and Bayesian network | ||
نویسندگان [English] | ||
Amin Ghamari Moghaddam1؛ Habibollah Nakhaei2 | ||
1PhD student, Accounting Course, Islamic Azad University, Ghaenat Branch | ||
2Assistant professor, Department of accounting, Birjand Branch, Islamic Azad University, Birjand, Iran | ||
چکیده [English] | ||
Many companies disrupt the economic system by violating their financial statements, which has led to a major economic crisis. There are various diagnostic strategies that are mostly human. These solutions have high costs for calculating and reviewing the financial statements of all companies, so we must look for a solution that can use data mining and automation to perform this diagnostic process. Of course, data mining methods have also been proposed for this case, each of which has advantages and disadvantages. The data mining methods presented so far have high computational overhead or low accuracy. However, in the method proposed in this research, the improved ID3 decision tree with Bayesian network and support vector machine has been used as a combined method. In this proposed method, to improve performance and accuracy, the rough set algorithm and hierarchical analysis are used to select effective features. The tree created in the proposed method has the lowest possible depth and therefore has a high velocity. The computational overhead of the proposed method is low due to the use of an optimal algorithm. The data used in the evaluation of 3-year data from 60 companies. In evaluating the proposed method, it is shown that the proposed method has an accuracy of 80%, which is considered to be high accuracy compared to similar methods. The time overhead in the proposed method is O(m.n) and the memory overhead is O(n) where m represents the size of the training set and n represents the feature set used in the training | ||
کلیدواژهها [English] | ||
Bayesian network, Support vector machine, decision tree, fuzzy rough, hierarchical analysis, fraud | ||
سایر فایل های مرتبط با مقاله
|
||
مراجع | ||
| ||
آمار تعداد مشاهده مقاله: 125 تعداد دریافت فایل اصل مقاله: 73 |