مع زيادة استخدام الهواتف ازداد استخدام الرسائل النصية بشكل كبير ومع انخفاض
تكلفة هذه الرسائل بدأ الناس في استخدامها لأغراض ترويجية وانشطة غير أخلاقية.
وقد أدى ذلك الى زيادة هائلة في الرسائل العشوائية (SPAM) مما قد تكون سبباً كبيراً في فقدان البيانات او الغش للحصول على معلومات سرية مثل البيانات البنكية.
وبالتالي يهدف هذا البحث الى تصنيف الرسائل العشوائية (SPAM) والرسائل الطبيعية (HAM) بشكل فعال وفي قت قصير.
تم استخدام مجموعة بيانات تحتوي على آلاف الرسائل النصية التي تحتوي على رسائل طبيعية و عشوائية، تم استخدام خوارزمية (Multiomail Naïve Bayes) و (Decision Tree) و (Random Forest).
بعد تجربة هذه الخوارزميات، حققت خوارزمية (Random Forest) اعلى دقة وقدرها 0.993 في 0.150 ثانية