جامعة المشرق

نموذج اكتشاف الرسائل العشوائية في خدمة الرسائل القصيرة بناءاً على تقنيات التعلم الآلي

المُستخلص

مع زيادة استخدام الهواتف ازداد استخدام الرسائل النصية بشكل كبير ومع انخفاض
تكلفة هذه الرسائل بدأ الناس في استخدامها لأغراض ترويجية وانشطة غير أخلاقية.
وقد أدى ذلك الى زيادة هائلة في الرسائل العشوائية (SPAM) مما قد تكون سبباً كبيراً في فقدان البيانات او الغش للحصول على معلومات سرية مثل البيانات البنكية.
وبالتالي يهدف هذا البحث الى تصنيف الرسائل العشوائية (SPAM) والرسائل الطبيعية (HAM) بشكل فعال وفي قت قصير.
تم استخدام مجموعة بيانات تحتوي على آلاف الرسائل النصية التي تحتوي على رسائل طبيعية و عشوائية، تم استخدام خوارزمية (Multiomail Naïve Bayes) و (Decision Tree) و (Random Forest).
بعد تجربة هذه الخوارزميات، حققت خوارزمية (Random Forest) اعلى دقة وقدرها 0.993 في 0.150 ثانية

Abstract

With the increase in the use of mobile phones, the use of Short Message Service has increased exponentially. With the cost of text messages dropping, people started using them for promotional purposes and unethical activities. This led to a massive increase in spam and consequently the loss of personal and financial data. To prevent data loss, it is essential that spam is detected as quickly as possible. Thus, this paper aims to classify spam not only effectively but also in a short time using python. A dataset containing thousands of text messages containing natural messages (ham) and spam messages was used. Natural language processing techniques were used Multiomail Naive Bayes, Decision Tree and Random Forest are used through which we can classify the message type. After applying these algorithms, Random Forest algorithm got the best accuracy 0.993 in 0.150 seconds.

الطالب/الطلاب

  • احمد حامد عثمان احمد — abo.hyzar41@gmail.com

المُشرف

  • د. محمد بدوي الخليفة — dr.badawey@gmail.com

أهداف التنمية المُستدامة

يساهم هذا البحث في تعزيز أهداف التنمية المُستدامة التالية :

انظر ايضاً