الرئيسيةالتكنولوجياطلاب الدكتوراة السعوديون يُطلقون أداة MiniGPT-4، هل يمكنها أن تنافس ChatGPT-4؟

طلاب الدكتوراة السعوديون يُطلقون أداة MiniGPT-4، هل يمكنها أن تنافس ChatGPT-4؟

قام فريق من طلبة الدكتوراة في السعودية بتطوير أداة مدعومة جديدة مدعومة بالذكاء الاطناعي، MiniGPT-4، والذي لديه مميزات مشابهة لChatGPT-4 الذي طورته OpenAI.

منذ إطلاق “شات جي بي تي” في نوفمبر وأن أصبح ذا شهرة عالمية، لم يفعل المطورين أي شيء سوى تطوير أدوات ذكاء اصطناعي جديدة تقوم إما بمنافسة روبوت الدردشة الشهير، أو أن تُكمِّله.

إن MiniGPT-4، والذي تم تطويره بواسطة نموذج “شات جي بي تي” هو آخر مثال.

اقرأ أيضًا: بيل جيتس: روبوتات الدردشة المدعومة بالذكاء الاصطناعي قد تساعد الأطفال في القراءة في غضون 18 شهرًا

تقول Future Tools أن “هذه الأداة لديها القدرة على إنشاء أوصاف تفصيلية للصور، وإنشاء مواقع الويب من المسودات المكتوبة بخط اليد، وكتابة القصص والقصائد المستوحاة من صور مُعطاة، وتقديم حلول للمشاكل الظاهرة في الصور، وتعليم المستخدمين كيفية الطبخ وفقًا لصور الأطعمة،”.

عند إطلاق ChatGPT-4، تم إظهار فيديو للنموذج وهو يبني موقعًا من صورة تخطيطية. وفقًا لتغريدة من قبل Barsee، فإن لدى MiniGPT-4 القدرة على أن يحقق نفس النجاح. الاختلاف الوحيد هو أن ChatGPT-4 غير متاحًا للجميع في الوقت الحالي، بينما انطلق MiniGPT-4 في مسيرته بالفعل.

فهم MiniGPT

وفقًا لGhacks، يستخدم MiniGPT-4 نموذج لغوي كبير -LLM- يُدعى Vicuna باعتباره وحدة فك ترميز اللغة، والذي تم إنشاؤه على LLaMa ويُقال إنه يحقق 90٪ من جودة “شات جي بي تي” كما تم تقييمها بواسطة GPT-4.

استخدم نموذج الذكاء الاصطناعي المكون المدرب مسبقًا للتدريب المسبق على صورة Bootstrapping Language (BLIP-2) وأضف طبقة إضافية واحدة لمحاذاة الميزات المرئية المشفرة مع نموذج لغة Vicuna عن طريق تجميد جميع مكونات الرؤية واللغة الأخرى.

يقول ديفيد واتسون أن MiniGPT خفيف الوزن، ويمكن تطبيقه بسهولة في مواقف الوقت الفعلي مثل روبوتات الدردشة، والمساعدين الافتراضيين، وأنظمة التسميات التوضيحية الأوتوماتيكية.

إنه يذكر أيضًا عدة تطبيقات ممكنة قد تكون استخدامات جيدة لMiniGPT-4: إنشاء أنظمة تسميات توضيحية تتطلب مصادر خفيفة الوزن فقط: ووصف صور للمكفوفين عبر الوصف الوصتي، وهذه طريقة قد تتطلب نظام تحويل نصوص إلى صوت.

بينما أكدت OpenAI قدرات GPT-4 متعددة النماذج، فإنهم لم يقوموا بإطلاق قدرات معالجة الصورة الخاصة به بعد. إن MiniGPT-4 يسد هذه الفجوة عبر معالجة الصور بالإضافة إلى اللغات باستخدام نموذج لغوي كبيرة “LLM” أكثر تطورًأ.

أداة ذكاء اصطناعي لتساعد في الأبحاث

يقول الخبراء إن نموذج اللغة التأسيسي الأكثر حداثة المستخدم مصمم لمساعدة الباحثين في تطوير عملهم في هذا القطاع الخاص بالذكاء الاصطناعي.

نظرًا لأن OpenAI لم تكشف عن الكثير من المعلومات حول بنية GPT-4، أو حجم النموذج، أو الأجهزة، أو حساب التدريب، أو تكوين مجموعة البيانات أو طريقة التدريب، فقد تكون طبيعة المصدر المفتوح لـ MiniGPT-4 ذات قيمة خاصة للباحثين.

قالت يانا خارا، التي تكتب في Analytics Vidhaya: “توفر قدرة MiniGPT على معالجة الصور للباحثين فرصًا جديدة لاستقصاء العلاقة بين نماذج اللغة والرؤية”.

“عبر تقديم نموذج أصغر وأسهل في الوصول للباحثين ليعملوا به، فإن MINIGPT-4 يمكنه أن يقود الابتكار والتطويرات في تكنولوجيا الذكاء الاصطناعي”.

“علاوة على ذلك، يضمن أساس المصدر المفتوح للنموذج أن يتمكن مجتمع البحث من التعاون وتبادل النتائج التي توصلوا إليها لتحقيق مزيد من التقدم في هذا المجال.”

MiniGPT ينقل شرح الصور إلى مستوى آخر

Barsee، الذي نشر تغريدة عن كيفية استخدام MiniGPT-4 للدردشة بالصور، قام بتضمين الحالات الآتية:

إصلاح الأشياء التالفة

من خلال تحميل صورة لعنصر مكسور على منصة MiniGPT والسؤال عن كيفية إصلاح الحالة التي في الصورة، سيشرح روبوت المحادثة الحالة التي في الصورة ويقترح طرقًا لإصلاح المشكلات التي تم تحديدها.

في التغريدة، يمكن لـ MiniGPT تحديد المشكلة بسهولة، مثل تسريب الغسالة، وشرح أسباب حدوث التسرب، وكذلك تقديم قائمة بالحلول التي يمكن للمستخدم تجربتها.

كتابة الإعلانات

في تغريدة أخرى من Barsee على موضوع MiniGPT، قام بتضمين سيناريو حيث تم إعطاء MiniGPT صورة لكوب يصنعه المستخدم ويبيعه. ثم يطلب المستخدم من الشات بوت كتابة إعلان لتسويق الأكواب، وهو ما يفعله الشات بوت على نحوٍ وافٍ.

مقدمات قصيرة

ما عليك سوى تحميل صورة فيلم واطلب من MiniGPT إعطائك مقدمة قصيرة؛ سوف ينتج بعد ذلك فقرة مقدمة للفيلم المعني. كما هو موضح في التغريدة، يتعرف روبوت المحادثة MiniGPT على الصورة من “The Godfather” ويكتب مقدمة عن الفيلم وفقًا للتعليمات.

شهد السوق عددًا لا يحصى من أدوات الذكاء الاصطناعي الجديدة التي تم تطويرها منذ إطلاق “شات جي بي تي”. هناك المزيد من البدائل لبرنامج روبوت الدردشة الشهير حيث ورد أن الآخرين يتفوقون عليه، ليس أقلها Auto-GPT، والتي لا تزال تُحدث موجات في مجتمع الذكاء الاصطناعي. بهذا المعدل، يبدو أنه من المحتم تقريبًا أن ينتهي بنا المطاف بإحراج ثروات الذكاء الاصطناعي لأي مهمة بشرية تقريبًا.

مقالات ذات صلة

آخر فيديو

الأكثر شهرة