والمنطق وراء هذه الطبقة هو أنه بمجرد أن نعلم أن ميزة معينة موجودة في أبعاد المدخلات الأصلية ستكون هناك قيمة تنشيط عالية ، فإن موقعها الدقيق ليس بنفس أهمية موقعها النسبي بالنسبة إلى الميزات الأخرى ، وعلاوة على ذلك تقلل هذه الطبقة بشكل كبير من أبعاد حجم مدخلات خرائط الميزات إلى الطبقات الأخرى حيث يتغير الطول والعرض فقط وليس العمق وهذا يخدم غرضين رئيسيين: والثاني هو أنه سيتحكم في مشكلة فرط التدريب Overfitting و يشير هذا المصطلح إلى تفوق النموذج في تصنيف بيانات التدريب وعدم قدرته على تعميم نتائجه بشكل جيد على بيانات لم يرها مسبقاً فعلى سبيل المثال قد يحصل النموذج على نسبة 100% أو 99% من الدقة على مجموعة التدريب مجموعة القطط التي تدرب على تصنيفها بينما يفشل في التعرف على بيانات الاختبار صور لقطط لم يتم يتدرب عليها النموذج ويحصل على دقة تساوي 50% والتي تعتبر دقة سيئة جداً لنموذج ذكاء اصطناعي! يهدف ذلك إلى منع ارتفاع درجات الحرارة عالميا أكثر من 2 درجة مئوية، ويتطلب تحقيقه تطبيق سياسات مناخية صارمة من أجل خفض الانبعاثات.
العملية التي تقوم فيها الخوارزمية بتعديل أوزانها تكون من خلال النزول المتدرج، مما يسمح للنموذج بتحديد اتجاهه نحو تقليل الأخطاء أو تصغير دالة التكلفة.