DELMON POST LOGO

الشبكة العصبية التكاثفية في التعلم العميق

بقلم : د. جاسم حاجي

في العقود القليلة الماضية، أثبتت تقنية التعلم العميق (Deep Learning) أنها أداة قوية جدًا بسبب قدرتها على التعامل مع كميات كبيرة من البيانات. لقد تجاوز اهتمام استخدام الطبقات المخفية التقنيات التقليدية، وخاصة في مجال التعرف على الأنماط. واحدة من أشهر الشبكات العصبية العميقة هي الشبكات العصبية التكاثفية (Convolutional Neural Networks)، المعروفة أيضًا بـ CNN أو ConvNet في مجال التعلم العميق، خاصة عندما يتعلق الأمر بتطبيقات رؤية الحاسوب.

منذ الخمسينيات من القرن الماضي، وفي الأيام الأولى للذكاء الاصطناعي، كان الباحثون يكافحون لإنشاء نظام يمكنه فهم البيانات البصرية. في السنوات التالية، أصبح هذا المجال يُعرف برؤية الحاسوب. في عام 2012، قامت مجموعة من الباحثين في جامعة تورنتو بخطوة كبيرة في مجال رؤية الحاسوب عندما قاموا بتطوير نموذج ذكاء اصطناعي يفوق أفضل خوارزميات التعرف على الصور، وذلك بفارق كبير.

نظام الذكاء الاصطناعي الذي أصبح معروفًا باسم أليكسنت (مسمى على اسم مبتكره الرئيسي، أليكس كريزيفسكي) فاز في مسابقة ImageNet لرؤية الحاسوب في عام 2012 بدقة مذهلة تبلغ 85 في المائة. في المركز الثاني، حققت نتيجة متواضعة بنسبة 74 في المائة.

وكان في قلب أليكسنت شبكات العصب الكونفولوشنال، وهي نوع خاص من الشبكات العصبية تحاكي إلى حد ما رؤية الإنسان. على مر السنين، أصبحت الشبكات العصبية التكاثفية جزءًا هامًا جدًا من العديد من تطبيقات رؤية الحاسوب وبالتالي جزءًا من أي دورة تعليمية عبر الإنترنت في رؤية الحاسوب. لذا دعونا نلقي نظرة على كيفية عمل الشبكات العصبية التكاثفية أو خوارزمية الشبكات العصبية التكاثفية في التعلم العميق.

خلفية الشبكات العصبية التكاثفية

تم تطوير شبكات العصبية التكاثفية لأول مرة واستخدامها في الثمانينيات من القرن الماضي تقريبا. كان أقصى ما يمكن لشبكة العصبية التكاثفية أن تفعله في ذلك الوقت هو التعرف على الأرقام المكتوبة يدويًا. كانت تُستخدم بشكل رئيسي في قطاع البريد لقراءة الرموز البريدية وما إلى ذلك. الشيء المهم لتذكره حول أي نموذج تعلم عميق هو أنه يتطلب كمية كبيرة من البيانات للتدريب ويتطلب أيضًا الكثير من موارد الحوسبة. كان هذا عائقًا كبيرًا لشبكات العصبية التكاثفية في تلك الفترة، ولذلك كانت تقتصر فقط على قطاع البريد وفشلت في دخول عالم تعلم الآلة.

في عام 2012، أدرك أليكس كريزيفسكي أنه حان الوقت لإحياء فرع التعلم العميق الذي يستخدم شبكات عصبية ذات طبقات متعددة. توفر وجود مجموعات كبيرة من البيانات، وتحديداً مجموعات بيانات ImageNet التي تحتوي على ملايين الصور المصنفة ووفرة الموارد الحوسبية للباحثين القدرة على إحياء شبكات العصبية التكاثفية.

ما هي الشبكة العصبية التكاثفية؟

في التعلم العميق، الشبكة العصبية التكاثفية (CNN/ConvNet) هي فئة من الشبكات العصبية العميقة، يتم تطبيقها بشكل شائع بشكل أكبر لتحليل الصور المرئية. الآن عندما نفكر في شبكة عصبية، نفكر في عمليات ضرب المصفوفات، ولكن هذا ليس الحال مع الشبكة التكاثفية. إنها تستخدم تقنية خاصة تسمى التحويل التكاثفي. الآن في الرياضيات، التحويل التكاثفي هو عملية رياضية على وظيفتين تنتج وظيفة ثالثة تعبر عن كيفية تعديل شكل إحدى الوظائف بواسطة الأخرى.

ولكننا لا نحتاج حقًا إلى الخوض في الجزء الرياضي لفهم ما هي الشبكة العصبية التكاثفية أو كيف تعمل.