Cross-Validation

التحقق المتقاطع: تقييم أداء النماذج في التعلم الآلي

التحقق المتقاطع (Cross-Validation) هو تقنية أساسية في مجال التعلم الآلي لتقييم أداء نموذج تنبؤي، وتحديد مدى قدرته على التعميم على بيانات جديدة وغير مرئية. بدلًا من الاعتماد على تقسيم بسيط للبيانات إلى مجموعتي بيانات التدريب وبيانات الاختبار، يستخدم التحقق المتقاطع عدة تقسيمات لبيانات التدريب لتدريب وتقييم النموذج بشكل متكرر. هذا يوفر تقديرًا أكثر موثوقية لأداء النموذج مقارنة بتقسيم واحد فقط.

لماذا نستخدم التحقق المتقاطع؟

الهدف الرئيسي من أي نموذج تنبؤ هو القدرة على أداء جيد على البيانات الجديدة. إذا قمنا بتدريب النموذج فقط على مجموعة واحدة من بيانات التدريب واختبرناه على مجموعة بيانات اختبار واحدة، فقد نحصل على نتائج مضللة. قد يكون النموذج قد "حفظ" بيانات التدريب بدلًا من تعلم الأنماط العامة، مما يؤدي إلى أداء ضعيف على البيانات الجديدة (وهذه الحالة تعرف باسم الإفراط في التخصيص).

التحقق المتقاطع يقلل من خطر الإفراط في التخصيص من خلال:

استخدام أجزاء مختلفة من البيانات للتدريب والاختبار.
توفير تقدير متوسط لأداء النموذج.
المساعدة في اختيار أفضل خوارزمية ومعلمات للنموذج.

أنواع التحقق المتقاطع

هناك عدة أنواع من التحقق المتقاطع، وأكثرها شيوعًا هي:

k-Fold Cross-Validation: هذه هي الطريقة الأكثر استخدامًا. يتم تقسيم البيانات إلى *k* من الأجزاء المتساوية (fold). في كل تكرار، يتم استخدام *k-1* من الأجزاء لتدريب النموذج، والجزء المتبقي يستخدم لاختبار النموذج. يتم تكرار هذه العملية *k* مرة، مع استخدام جزء مختلف للاختبار في كل مرة. يتم حساب متوسط أداء النموذج عبر جميع التكرارات للحصول على تقدير نهائي.

   مثال: إذا اخترنا k=5، فسيتم تقسيم البيانات إلى 5 أجزاء. في التكرار الأول، يتم تدريب النموذج على الأجزاء 2، 3، 4، و 5، ويتم اختباره على الجزء 1. في التكرار الثاني، يتم تدريب النموذج على الأجزاء 1، 3، 4، و 5، ويتم اختباره على الجزء 2، وهكذا.

Leave-One-Out Cross-Validation (LOOCV): حالة خاصة من k-Fold Cross-Validation حيث *k* يساوي عدد نقاط البيانات في مجموعة التدريب. في كل تكرار، يتم تدريب النموذج على جميع نقاط البيانات باستثناء واحدة، ويتم استخدام نقطة البيانات المستبعدة للاختبار. هذه الطريقة مكلفة حسابيًا للبيانات الكبيرة، ولكنها توفر تقديرًا غير متحيز لأداء النموذج.

Stratified k-Fold Cross-Validation: مفيد بشكل خاص لمجموعات البيانات غير المتوازنة (حيث تكون بعض الفئات ممثلة بشكل أقل من غيرها). يضمن هذا النوع من التحقق المتقاطع أن كل جزء يحتوي على نفس نسبة الفئات الموجودة في مجموعة البيانات الأصلية.

Repeated k-Fold Cross-Validation: يتم تكرار عملية k-Fold Cross-Validation عدة مرات مع تقسيمات مختلفة للبيانات. هذا يمكن أن يوفر تقديرًا أكثر استقرارًا لأداء النموذج.

أنواع التحقق المتقاطع
النوع	الوصف	الاستخدامات
k-Fold Cross-Validation	تقسيم البيانات إلى k جزء، تدريب واختبار على أجزاء مختلفة.	الأكثر شيوعًا، مناسب لمعظم مجموعات البيانات.
Leave-One-Out Cross-Validation (LOOCV)	تدريب على جميع البيانات باستثناء نقطة واحدة، اختبار على تلك النقطة.	مجموعات البيانات الصغيرة.
Stratified k-Fold Cross-Validation	يضمن تمثيلًا متساويًا للفئات في كل جزء.	مجموعات البيانات غير المتوازنة.
Repeated k-Fold Cross-Validation	تكرار k-Fold Cross-Validation عدة مرات.	الحصول على تقدير أكثر استقرارًا.

تطبيق التحقق المتقاطع في تداول الخيارات الثنائية

على الرغم من أن التحقق المتقاطع يستخدم بشكل أساسي في مجال التعلم الآلي، إلا أن مبادئه يمكن تطبيقها على استراتيجيات تداول الخيارات الثنائية. على سبيل المثال، يمكن استخدامها لتقييم أداء مؤشر فني أو مجموعة من المؤشرات الفنية في التنبؤ بحركة سعر الأصل.

يمكن تقسيم البيانات التاريخية إلى عدة أجزاء.
في كل جزء، يتم تدريب الاستراتيجية على البيانات السابقة، ويتم اختبارها على البيانات الحالية.
يتم حساب متوسط الأداء عبر جميع الأجزاء لتقييم فعالية الاستراتيجية.

اعتبارات مهمة

اختيار قيمة k: عادةً ما يتم استخدام قيم k مثل 5 أو 10. تعتمد القيمة المثالية على حجم مجموعة البيانات وتعقيد النموذج.
التكلفة الحسابية: يمكن أن يكون التحقق المتقاطع مكلفًا حسابيًا، خاصةً بالنسبة للنماذج المعقدة ومجموعات البيانات الكبيرة.
تسرب البيانات: من المهم التأكد من عدم وجود تسرب للبيانات بين مجموعات التدريب والاختبار. على سبيل المثال، إذا كنت تستخدم بيانات السلاسل الزمنية، فيجب عليك التأكد من أن البيانات المستقبلية لا يتم استخدامها لتدريب النموذج.

أدوات ومكتبات

هناك العديد من الأدوات والمكتبات التي تسهل عملية التحقق المتقاطع، بما في ذلك:

Scikit-learn (بايثون): مكتبة شاملة للتعلم الآلي تتضمن وظائف للتحقق المتقاطع.
R (لغة البرمجة): توفر العديد من الحزم للتحقق المتقاطع.
Weka (برنامج): منصة مفتوحة المصدر للتعلم الآلي تتضمن أدوات للتحقق المتقاطع.

روابط ذات صلة

استراتيجيات تداول وتحليل

المراجع

Hastie, T., Tibshirani, R., & Friedman, J. (2009). *The elements of statistical learning: Data mining, inference, and prediction*. Springer.
Goodfellow, I., Bengio, Y., & Courville, A. (2016). *Deep learning*. MIT press.

[[Category:**الفئة:التعلم_الآلي**]

ابدأ التداول الآن

سجل في IQ Option (الحد الأدنى للإيداع $10) افتح حساباً في Pocket Option (الحد الأدنى للإيداع $5)

انضم إلى مجتمعنا

اشترك في قناة Telegram الخاصة بنا @strategybin للحصول على: ✓ إشارات تداول يومية ✓ تحليلات استراتيجية حصرية ✓ تنبيهات باتجاهات السوق ✓ مواد تعليمية للمبتدئين