DELMON POST LOGO

الذكاء الاصطناعي التوليدي

بقلم : د. جاسم حاجي
الموجة الجديدة من أنظمة الذكاء الاصطناعي التوليدية، مثل ChatGPT، لديها القدرة على تحويل صناعات بأكملها. لكي تكون رائدا في الصناعة في غضون خمس سنوات، تحتاج إلى استراتيجية ذكاء اصطناعي توليدية واضحة ومقنعة اليوم.
نحن ندخل فترة من تغيير الأجيال في الذكاء الاصطناعي. حتى الآن، لم تتمكن الآلات أبدا من إظهار سلوك لا يمكن تمييزه عن البشر. لكن نماذج الذكاء الاصطناعي التوليدية الجديدة ليست قادرة فقط على إجراء محادثات متطورة مع المستخدمين؛ بل إنها تولد أيضا محتوى يبدو أصليا.
ما هو الذكاء الاصطناعي التوليدي؟
للحصول على ميزة تنافسية، يحتاج قادة الأعمال أولا إلى فهم ما هو الذكاء الاصطناعي التوليدي.
الذكاء الاصطناعي التوليدي هو مجموعة من الخوارزميات، قادرة على توليد محتوى جديد وواقعي على ما يبدو - مثل النص أو الصور أو الصوت - من بيانات التدريب. يتم بناء أقوى خوارزميات الذكاء الاصطناعي التوليدية فوق النماذج الأساسية التي يتم تدريبها على كمية هائلة من البيانات غير المصنفة بطريقة خاضعة للإشراف الذاتي لتحديد الأنماط الأساسية لمجموعة واسعة من المهام.
على سبيل المثال، يمكن تكييف GPT-3.5، وهو نموذج أساسي مدرب على كميات كبيرة من النصوص، للإجابة على الأسئلة أو تلخيص النص أو تحليل المشاعر. يمكن تكييف DALL-E، وهو نموذج أساسي متعدد الوسائط (من النص إلى صورة)، لإنشاء صور أو توسيع الصور إلى ما هو أبعد من حجمها الأصلي أو إنشاء أشكال مختلفة من اللوحات الموجودة.
ما الذي يمكن أن يفعله الذكاء الاصطناعي  التوليدي؟
هذه الأنواع الجديدة من الذكاء الاصطناعي التوليدي لديها القدرة على تسريع اعتماد الذكاء الاصطناعي بشكل كبير، حتى في المنظمات التي تفتقر إلى الذكاء الاصطناعي العميق أو الخبرة في علوم البيانات. في حين أن التخصيص الكبير لا يزال يتطلب الخبرة، فإن اعتماد نموذج توليدي لمهمة محددة يمكن إنجازه بكميات منخفضة نسبيا من البيانات أو الأمثلة من خلال واجهات برمجة التطبيقات أو عن طريق الهندسة الفورية. يمكن تلخيص القدرات التي يدعمها الذكاء الاصطناعي التوليدي إلى ثلاث فئات:
توليد المحتوى والأفكار. إنشاء مخرجات جديدة وفريدة من نوعها عبر مجموعة من الطرائق، مثل إعلان الفيديو أو حتى بروتين جديد له خصائص مضادة للميكروبات.
تحسين الكفاءة. تسريع المهام اليدوية أو المتكررة، مثل كتابة رسائل البريد الإلكتروني أو الترميز أو تلخيص المستندات  الكبيرة.
إضفاء الطابع الشخصي على التجارب. إنشاء محتوى ومعلومات مصممة خصيصا لجمهور معين، مثل روبوتات الدردشة لتجارب العملاء الشخصية أو الإعلانات المستهدفة استنادا إلى أنماط في سلوك عميل معين.
اليوم، تم تدريب بعض نماذج الذكاء الاصطناعي التوليدية على كميات كبيرة من البيانات الموجودة على الإنترنت، بما في ذلك المواد المحمية بحقوق الطبع والنشر. لهذا السبب، أصبحت ممارسات الذكاء الاصطناعي المسؤولة حتمية تنظيمية.
كيف يحكم الذكاء الاصطناعي التوليدي؟
تعمل أنظمة الذكاء الاصطناعي التوليدية على إضفاء الطابع الديمقراطي على قدرات الذكاء الاصطناعي التي كان يتعذر الوصول إليها سابقا بسبب نقص بيانات التدريب وقوة الحوسبة المطلوبة لجعلها تعمل في سياق كل منظمة. يعد اعتماد الذكاء الاصطناعي على نطاق أوسع أمرا جيدا، ولكن يمكن أن يصبح مشكلة عندما لا يكون لدى المنظمات هياكل حوكمة  مناسبة.
هي أنواع نماذج الذكاء الاصطناعي التوليدية؟
أنواع النماذج النصية.
‏GPT-3 أو Generative Pretrained Transformer 3.
هو نموذج رجعي تلقائي مدرب مسبقا على مجموعة كبيرة من النص لتوليد نص لغة طبيعية عالي الجودة. تم تصميمه ليكون مرن ويمكن ضبطه لمجموعة متنوعة من المهام اللغوية، مثل ترجمة اللغة والتلخيص والإجابة على الأسئلة.
نموذج اللغة لتطبيقات الحوار او (LaMDA) هو نموذج لغة محول مدرب مسبقا لتوليد نص لغة طبيعية عالي الجودة، على غرار GPT. ومع ذلك، تم تدريبه على الحوار بهدف التقاط الفروق الدقيقة في المحادثة المفتوحة.
‏LLaMA
هو نموذج أصغر لمعالجة اللغة الطبيعية، ويهدف أن يكون أداء. على الرغم من كونه أيضا نموذجا لغويا ذاتي الانحدار يعتمد على المحولات، إلا أنه يتم تدريبه على المزيد من الرموز لتحسين الأداء بأعداد أقل من المعلمات.
أنواع النماذج متعددة الوسائط.
‏GPT-4
هو أحدث إصدار من فئة GPT من النماذج، وهو نموذج واسع النطاق متعدد الوسائط يمكنه قبول مدخلات الصور والنصوص وإنتاج مخرجات نصية. GPT-4 هو نموذج قائم على المحولات مدرب مسبقا للتنبؤ بالرمز التالي في المستند. تؤدي عملية المواءمة بعد التدريب إلى تحسين الأداء على مقاييس الواقعية والالتزام بالسلوك  المطلوب.
‏DALL-E
هو نوع من الخوارزميات متعددة الوسائط التي يمكن أن تعمل عبر طرائق بيانات مختلفة وإنشاء صور أو أعمال فنية جديدة من إدخال نص اللغة الطبيعية.
بالإضافة إلى الانتشار المستقر وهو نموذج تحويل النص إلى صورة، ولكنه يستخدم عملية تسمى "الانتشار" لتقليل الضوضاء تدريجيا في الصورة حتى تتطابق مع وصف النص.
‏Progen
هو نموذج متعدد الوسائط يتم تدريبه على 280 مليون عينة بروتين لتوليد البروتينات استنادا إلى الخصائص المطلوبة والمحددة باستخدام إدخال نص اللغة  الطبيعية.