وإذ OpenAI عن سلسلة o3 من الذكاء الصناعي التي تعمل على “المنطق” الشهر الماضي، جاهدت معًا معًا، بما في ذلك النموذج النموذجي على التوجيه الداخلي، وفي حين كانت جميع درجات الاختبار المشتركة المتخصصة، وسلطت الضوء على الإمكانيات المحسنة لخليفة o1، برزت درجة معيارية واحدة.
معيار ARC-AGI، سجل نموذج اللغة الكبيرة (LLM) 85%، متغلبًا على نتيجة أفضل سابقًا بهامش 30، ومن المثير للاهتمام أن هذه النتيجة تساوي أيضًا ما سجله الإنسان العادي في الاختبار.
ومع ذلك، فقط أن o3 سجل مثل هذه الدرجة الممتازة في الاختبار، يعني هذا أن ذكائها يساوي ذكاء الإنسان العادي؟ “سوف أتمكن من الإجابة على هذا السؤال إذا تم إصدار نموذج الذكاء الاصطناعي في المجال العام وتمكنا من اختباره، ومجلساً لأن OpenAI لم تتأكد من أي شيء عن تأسيس النموذج أو تقنيات التدريب البيانات أو مجموعات، فمن الصعب ادعاء أي شيء بشكل قاطع.”
وهناك أشياء محددة منها نماذج من الذكاء الاصطناعي المعتمدة على المنطق والتي يمكن أن تساعدنا في فهم ما يمكن توقعه من برنامج الماجستير في القانون القادم من OpenAI، الاثنين، حتى الآن، لا تحتوي على نماذج سلسلة كبيرة في برامجها أو إطار ولكنها مُعدلة لتقديم الموهبة المحسنة.
على سبيل المثال، استخدم المطورون تقنية مع سلسلة o1 من نماذج الذكاء الاصطناعي تسمى الحوسبة في وقت الاختبار، الأشياء، نماذج منقحة من الذكاء الاصطناعي وقت التوقيع على طرح سؤال ومساحة عمل ميكانيكيات وتصحيح أي أخطاء، وبالتالي، كان نموذج GPT-4o نسخة مجردة مُعدل بدقة من GPT-4.
لم يتم الكشف عن أن الشركة قامت بإدانة كبيرة بالبنية مع o3، لأنها تُشاع أيضًا أنها تعمل على نموذج GPT-5 AI، والذي يمكن تخصيصه في وقت لاحق من هذا العام.
بالنسبة لعيار ARC-AGI (مجموعة الاستدلال المجرد – الذكاء العام الاصطناعي)، تتميز بسلسلة من طلبات التحديد على القائمة المطلوبة على الشبكة والتي تتطلب قدرات المنطق والفهم المكاني لحلها. يمكن القيام بذلك بسهولة باستخدام مجموعة بيانات كبيرة من البيانات عالية الجودة التي توفرها الأدلة المنطقية والقدرات.
ومع ذلك، إذا كان الأمر بهذه البساطة، فإن نماذج الذكاء الاصطناعي القديمة ستحقق أعلى مستوى في الاختبار أيضًا. والعكس صحيح أن أعلى درجة كانت 55 مقارنة بـ o3 و 85 منها. وهذا يسلط الضوء على أن المطورين تقنيات وخوارزميات تساعد بشكل جديد على إيجاد حل منطقي للنموذج. لا يمكن ذكر المدى الكامل لذلك ما لم المسجل OpenAI إذن عن العناصر الفنية.
ومع ذلك، فمن غير الوارد أن يصل نموذج الذكاء الاصطناعي o3 إلى مستوى الذكاء العام أو الذكاء البشري. الجدة، إذا كان الأمر كذلك، ستيكسمثل ذلك نهاية شراكة الشركة مع مايكروسوفت، والتي من المقرر أن تنتهي حتى وصول نماذج OpenAI إلى مستوى الذكاء العام. ثانيًا، ساهم العديد من خبراء الذكاء الاصطناعي، بما في ذلك جيفري هينتون، الأب الروحي للذكاء الاصطناعي، وأرقام التكرار الخاصة بنا على بعد سنوات عديدة من الوصول إلى الذكاء العام.
وأخيراً، يعد الذكاء العام متكاملاً وغير قادر على أنه إذا وصلت OpenAI إلى هذا الكمال، بالإضافة إلى التكامل الناس صراحةً أفضل من مشاركة تلميحات صغيرة له. الأمر الأكثر ترجيحًا هنا هو أن نموذج الذكاء الاصطناعي o3 وجد طريقة لتحسين قدرات التفكير في التقارير القائمة على النماذج (إما عن طريق إضافة بيانات أخذت كمية كافية أو عن طريق تعديل التدريب)، كما هو موضح أيضًا في تقرير PTI.