منوعات

الذكاء الاصطناعي والمنطق: إلى أي مدى وصل نموذج o3 الجديد من OpenAI؟

كشفت OpenAI عن سلسلة o3 من نماذج الذكاء الاصطناعي التي تركز على “المنطق” الشهر الماضي، وخلال بث مباشر شاركت الشركة درجات معيار النموذج بناءً على الاختبار الداخلي، وفي حين كانت جميع الدرجات المشتركة مثيرة للإعجاب، وسلطت الضوء على القدرات المحسنة لخليفة o1، برزت درجة معيارية واحدة.

وفي معيار ARC-AGI، سجل نموذج اللغة الكبيرة (LLM) 85%، متغلبًا على أفضل نتيجة سابقة بهامش 30 بالمائة، ومن المثير للاهتمام أن هذه النتيجة تساوي أيضًا ما سجله الإنسان العادي في الاختبار.

ومع ذلك، لمجرد أن o3 سجلت مثل هذه الدرجة العالية في الاختبار، فهل يعني هذا أن ذكائها يساوي ذكاء الإنسان العادي؟ سيكون من الأسهل الإجابة على هذا السؤال إذا تم إصدار نموذج الذكاء الاصطناعي في المجال العام وتمكنا من اختباره، ونظرًا لأن OpenAI لم تكشف عن أي شيء عن بنية النموذج أو تقنيات التدريب أو مجموعات البيانات، فمن الصعب ادعاء أي شيء بشكل قاطع.

وهناك أشياء معينة نعرفها عن نماذج الذكاء الاصطناعي التي تركز على المنطق والتي يمكن أن تساعدنا في فهم ما يمكن توقعه من برنامج الماجستير في القانون القادم من OpenAI، أولاً، حتى الآن، لا تحتوي نماذج سلسلة o على إصلاح كبير في بنيتها أو إطار عملها ولكنها مُعدلة بدقة لعرض القدرات المحسنة.

على سبيل المثال، استخدم المطورون تقنية مع سلسلة o1 من نماذج الذكاء الاصطناعي تسمى الحوسبة في وقت الاختبار، وبهذا، تم منح نماذج الذكاء الاصطناعي وقت معالجة إضافيًا لقضائه على سؤال ومساحة عمل لاختبار النظريات وتصحيح أي أخطاء، وبالمثل، كان نموذج GPT-4o مجرد نسخة مُعدلة بدقة من GPT-4.

من غير المرجح أن تقوم الشركة بإجراء تغييرات كبيرة على البنية مع نموذج o3، نظرًا لأنه يُشاع أيضًا أنها تعمل على نموذج GPT-5 AI، والذي يمكن إطلاقه في وقت لاحق من هذا العام.

بالنسبة لمعيار ARC-AGI (Abstract Reasoning Corpus – Artificial General Intelligence)، فإنه يتميز بسلسلة من أسئلة التعرف على الأنماط القائمة على الشبكة والتي تتطلب قدرات المنطق والفهم المكاني لحلها. يمكن القيام بذلك باستخدام مجموعة بيانات كبيرة من البيانات عالية الجودة التي تركز على المنطق القائم على المنطق والقدرات.

ومع ذلك، إذا كان الأمر بهذه البساطة، فإن نماذج الذكاء الاصطناعي القديمة كانت ستحقق درجات عالية في الاختبار أيضًا. والجدير بالذكر أن أعلى درجة سابقة كانت 55 بالمائة مقارنة بنتيجة o3 البالغة 85 بالمائة. وهذا يسلط الضوء على أن المطورين أضافوا تقنيات وخوارزميات تحسين جديدة لتعزيز قدرات المنطق للنموذج. لا يمكن ذكر المدى الكامل لذلك ما لم تكشف OpenAI رسميًا عن التفاصيل الفنية.

اظهر المزيد

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى
slot gacor buy138 buy138 gaya69
bonanza88 bonanza88