08:54 أفضل خوارزميات التعلم الآلي - مدونة SPOTO - مواد دراسية مفيدة لدراسة شهادة تكنولوجيا المعلومات
preloader

أفضل خوارزميات التعلم الآلي

أفضل خوارزميات التعلم الآلي
قد يستغرق العثور على خوارزمية مناسبة ساعات أو حتى أيام. وكما يقولون، أفضل خوارزمية هي تلك التي لا توجد بعد. هناك الكثير من البيانات الضخمة في علوم الكمبيوتر والتعلم الآلي – نحن لا نتحدث فقط عن بياناتك. غالبًا ما يشعر المبرمجون بالإرهاق بسبب جميع القرارات التي يجب اتخاذها عند إنشاء خوارزميات جديدة. في هذه المقالة، سنعرض لك بعض خوارزميات التعلم الآلي القياسية التي يجب أن تعرفها لتكون عالم بيانات مؤثر!
آلات دعم المتجهات (SVM)
آلات دعم المتجهات (SVM) هي خوارزمية تعلم آلي تقوم بتعيين البيانات العشوائية إلى مساحات عالية الأبعاد، وإيجاد مستوى فائق (خط يفصل بين فئتين) يزيد الهامش بين المستوى الفائق وأقرب نقطة بيانات. SVM هي طريقة تكرارية يمكن تدريبها من خلال تقريب الحل الأمثل بشكل متكرر لخطوات صغيرة.
SVM هو مصنف غير خطي يستفيد من بنية المساحات عالية الأبعاد للعثور على المميزات المثلى بين الفئات المختلفة. وهي واحدة من عدة طرق نواة غير خطية للتصنيف متعدد التسميات.
الانحدار الخطي
الانحدار الخطي هو أسلوب يُستخدم للتنبؤ بالنتائج العددية المستمرة بناءً على متغيرات مستقلة. وهو عبارة عن خوارزمية تعلّم خاضعة للإشراف نريد من خلالها إجراء تنبؤات على بيانات جديدة لم نستخدمها لتدريب النموذج. هناك نوعان من الانحدار الخطي، الانحدار الخطي البسيط، والانحدار الخطي المتعدد.
في الانحدار الخطي البسيط، لدينا متغير مستقل واحد متصل ومتغير تابع واحد متصل.
في الانحدار المتعدد، لدينا أكثر من متغير مستقل متصل ومتغير تابع متصل واحد.
الانحدار اللوجستي
الانحدار اللوجستي هو خوارزمية تصنيف، مما يعني أنه يتنبأ بنتيجة منفصلة. ويوجد نوعان من الانحدار اللوجستي، الانحدار اللوجستي الثنائي، والانحدار اللوجستي متعدد الحدود.
يُستخدم الانحدار اللوجستي الثنائي عندما يكون لدينا تأثيران منفصلان: نجاح أو رسوب، احتيال أو عدم احتيال، وهكذا.
ويُستخدم الانحدار اللوجستي متعدد الحدود عندما يكون لدينا أكثر من نتيجتين منفصلتين.
شجرة القرار
خوارزمية شجرة القرار هي تقنية تعلّم آلي تقوم بعمل تنبؤات من خلال تحليل المعلومات الموجودة في مجموعة من الملاحظات.
يمكن للخوارزمية أن تتنبأ باحتمالية وقوع حدث ما أو باحتمالية حدوث نتيجة معينة. وهي تعمل من خلال إنشاء بنية شجرية استنادًا إلى البيانات ثم استخدامها لإيجاد قواعد عامة يمكن تطبيقها على مواقف أكثر تعقيدًا.
في أبسط أشكالها، تعمل أشجار القرار من خلال إيجاد أنماط في البيانات. على سبيل المثال، لنفترض أن لديك قاعدة بيانات للعملاء الذين اشتروا منتجات من متاجر مختلفة ولديهم معلومات ديموغرافية عنهم. في هذه الحالة، يمكنك إنشاء شجرة قرارات تتنبأ بما إذا كانوا سيعودون للشراء مرة أخرى أم لا.
بايز الساذج
خوارزمية التعلّم الآلي الساذج باييز هي خوارزمية تعلّم تحت الإشراف للتصنيف. يمكن استخدامها للتنبؤ والتقدير والمتغيرات المستمرة المختلفة.
تستخدم هذه الخوارزمية نظرية بايز لتقدير احتمال وقوع حدث ما بمعلومية بعض الأدلة. وتسمى نتيجة هذا التقدير بالاحتمال اللاحق (PP) أو الاحتمال المخصص لحدث أو تسمية ما بمعلومية مجموعة من الملاحظات. خوارزمية التعلّم الآلي الساذج بايز هي إحدى خوارزميات التعلّم الآلي الأكثر شيوعًا المستخدمة في العديد من المجالات، بما في ذلك التسويق والتمويل والتنقيب عن النصوص وغيرها.
KNN (K- أقرب الجيران)
KNN (أقرب الجيران K-Nearest Neighbours) هي خوارزمية تتعلم التعيين من المدخلات إلى الهدف. وهي تعتمد على مفهوم أقرب الجيران، مما يعني أنه إذا كنت تعرف شيئًا عن أقرب الجيران، فيمكنك استخدام هذه المعلومات للتنبؤ بما سيحدث بعد ذلك في بيانات التدريب. وهذا ما يسمى بمشكلة “المستند المركب”.
تعمل خوارزمية KNN من خلال تدريب نموذج للعثور على أقرب التطابقات الممكنة لمستند الاستعلام. بعد ذلك، تستخدم السجلات الأكثر صلة بالاستعلام كأمثلة تدريب والباقي كبيانات اختبار.
يتم تحقيق ذلك باستخدام مقياس يُسمى “المسافة” بين مستندين (أو بشكل عام، بين حالتين). هناك العديد من الطرق المختلفة لحساب هذه المسافة: المسافة الإقليدية وتشابه جيب التمام وما إلى ذلك، ولكن جميعها لها خصائص متشابهة: فهي تقيس مدى تباعد ما بين شيئين من حيث عدد الروابط بينهما (أو من حيث عدد الكلمات المشتركة بينهما). وكلما زاد هذا العدد مقارنةً بالرقم 1 (الحالة المثالية)، كلما وجدنا تطابقًا أفضل!
ك-ميزان
K-means هي خوارزمية تعلم غير خاضعة للإشراف تستخدم مبدأ الحد الأدنى للمسافة لتجميع نقاط البيانات في مجموعات. وهي تعمل من خلال تعيين كل نقطة في مجموعة البيانات إلى مجموعة، أو عنقود، يكون مركزها النقطة التي لها أقل مسافات إجمالية من كل طرف. ثم تقوم الخوارزمية بتعديل موقع كل نقطة بشكل متكرر لتعظيم مجموع المربعات داخل المجموعة (WCS) وتقليل مجموع المربعات بين المجموعات (BSS).
يتضمّن تجميع K-means حساب النقط المركزية لكل نقطة من خلال إيجاد المسافة بينها وبين كل نقطة في مجموعتها ثم تعديل موقع تلك النقطة لتقليل المسافة بينها وبين جميع المسائل الأخرى في مجموعتها. يمكن القيام بذلك باستخدام متوسط مرجح واحد أو دالة أخرى لجميع المقاييس الفردية لكل نقطة.
تم استخدام K-means على نطاق واسع في العديد من المجالات، بما في ذلك الرؤية الحاسوبية والتعلم الآلي والتعرف على الأنماط. تعتبر إحدى أبسط الطرق لتجميع البيانات نظرًا لطبيعتها البديهية؛ ومع ذلك، يمكن أن تكون غير فعالة إذا تم تنفيذها بشكل سيئ بسبب مشاكل الإفراط في التجميع التي تنشأ عند استخدام عينات بيانات التدريب من فئة واحدة فقط (مثل جميع النقاط الحمراء).
الغابة العشوائية
خوارزميات التعلّم الآلي للغابات العشوائية هي مجموعة من الطرق للتنبؤ بنتائج الأحداث المستقبلية. تعتمد هذه الطريقة على فكرة إنشاء العديد من أشجار القرار باستخدام مجموعات فرعية عشوائية من بيانات التدريب. ثم يتم دمج هذه المجموعات الفرعية لإنتاج مجموعات جديدة تحتوي على معلومات أكثر من أي شجرة قرار فردية. وهذا يسمح بالتنبؤ بشكل أفضل لأن كل شجرة لديها إمكانية الوصول إلى معلومات أكثر من سابقاتها، مما يجعل العثور على الأنماط في البيانات أكثر سهولة.
يمكن استخدام خوارزميات الغابة العشوائية في العديد من مجالات الأعمال والتكنولوجيا، بما في ذلك التسويق والتمويل والتجارة الإلكترونية. وهي مفيدة بشكل خاص عند تطبيقها على مجموعات البيانات التي يصعب أو يكلف تحليلها بطرق أخرى. على سبيل المثال، يمكن أن تساعد الشركات على فهم سلوك المستهلكين من خلال تحليل عمليات الشراء التي تتم في مواقع مختلفة بمرور الوقت أو عبر التركيبة السكانية المختلفة.
خوارزميات تقليل الأبعاد
مع كل هذه البيانات، يجب أن نكون حذرين بشأن مقدار ما نستخدمه منها. يُطلق على استخدام جميع معلوماتك اسم نهج البيانات الكاملة. يمكن أن يؤدي استخدام الكثير من البيانات إلى إبطاء الخوارزمية الخاصة بك أو حتى التسبب في تعطلها، وهذا ليس بالأمر الجيد. أنت تريد استخدام أقل قدر ممكن من البيانات للتنبؤ بدقة. تُستخدم خوارزميات تقليل الأبعاد عندما تريد تقليل كمية البيانات المستخدمة لتدريب الخوارزمية. يمكنك استخدام هذه الخوارزميات عندما يكون لديك الكثير من البيانات، ولكن قد تكون الخوارزمية بطيئة للغاية. هناك العديد من خوارزميات تقليل الأبعاد المختلفة، ولكن هناك ثلاث خوارزميات شائعة. تحليل المكوّنات الرئيسية (PCA) تحليل القيمة المفردة (SVD) الغابة العشوائية.
خوارزميات تعزيز التدرج
تعزيز التدرج هو تقنية تجميعية. فكرة المجموعة هي إنشاء فريق من الخوارزميات. ومن ثم تتخصص كل خوارزمية في التنبؤ بأنواع معينة من الأخطاء التي لا تجيد الخوارزميات الأخرى التنبؤ بها. عندما تجمع بينها، تحصل على نموذج أكثر دقة. هناك العديد من الأنواع المختلفة من خوارزميات تعزيز التدرج التي يمكنك استخدامها في نماذجك. ثلاثة من أكثرها شيوعًا هي أشجار تعزيز التدرج (GBTs) أشجار تعزيز التدرج التكيفي (Ada Grad) تعزيز التدرج العشوائي (SGDB)
الخاتمة
تعد خوارزميات التعلم الآلي أداة قيّمة للاستخدام عند العمل مع البيانات. عند اختيار خوارزمية التعلم الآلي الصحيحة، من الضروري اختيار خوارزمية مناسبة لبياناتك ومشكلتك. تتوفر العديد من الأنواع المختلفة من خوارزميات التعلم الآلي لمختلف المهام، مثل الانحدار والتجميع والتصنيف. إذا كنت ترغب في أن تصبح عالم بيانات، عليك أن تفهم كيفية عمل خوارزميات التعلم الآلي. بالإضافة إلى ذلك، فإن الخوارزميات المختلفة هي الأفضل لمشاكل أخرى، لذا من الضروري أن تكون لديك معرفة واسعة بالخوارزميات المختلفة ومتى تستخدمها.

About the Author

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

Related Posts