تتحدى ELMAR من Got It AI و GPT-4 و LLaMa ، وتحقق نتائج جيدة في معايير الهلوسة

تتحدى ELMAR من Got It AI و GPT-4 و LLaMa ، وتحقق نتائج جيدة في معايير الهلوسة


انضم إلى كبار المديرين التنفيذيين في سان فرانسيسكو يومي 11 و 12 يوليو ، لمعرفة كيف يدمج القادة استثمارات الذكاء الاصطناعي ويحسنونها لتحقيق النجاح. يتعلم أكثر


أطلقت شركة Got It AI المبتدئة للمحادثة أحدث ابتكاراتها ELMAR (بنية نموذج لغة المؤسسة) ، وهو نموذج لغة كبير جاهز للمؤسسات (LLM) يمكن دمجه مع أي قاعدة معرفية لتطبيقات chatbot القائمة على الحوار. تدعي الشركة أن ELMAR أصغر بشكل ملحوظ من GPT-3 ويمكنها العمل في أماكن العمل ، مما يجعلها حلاً فعالاً من حيث التكلفة لعملاء المؤسسات.

بالإضافة إلى ذلك ، يتم تعزيز الجدوى التجارية لـ LLM من خلال استقلالها عن LLaMA من Facebook Research و Stanford’s Alpaca.

قال بيتر ريلان ، رئيس Got It AI ، لموقع VentureBeat: “تم تصميم ELMAR لأننا سمعنا من عملاء مؤسستنا في خط الأنابيب لدينا أنهم لا يريدون أن تغادر بياناتهم” أماكن عملهم “. “ومن ثم ، قلنا دعونا نبني نموذجًا صغيرًا وقابل للتطبيق تجاريًا يمكن تشغيله” محليًا “، ولكنه يتطابق مع LLMs المتاحة بدقة في حالات استخدام المؤسسة الرئيسية”.

يتضمن ELMAR أيضًا التحقق من صحة الردود والمعالجة اللاحقة للتخفيف من مخاطر معدلات الاستجابة غير الصحيحة للمستخدمين. مقارنةً بـ LLMs المتوفرة حاليًا ، تتطلب ELMAR أجهزة أقل تكلفة ، مما يجعلها خيارًا أكثر سهولة لمختبري الإصدارات التجريبية للمؤسسات الذين يمكنهم الاشتراك في الطيارين.

حدث

تحويل 2023

انضم إلينا في سان فرانسيسكو يومي 11 و 12 يوليو ، حيث سيشارك كبار المسؤولين التنفيذيين في كيفية دمج استثمارات الذكاء الاصطناعي وتحسينها لتحقيق النجاح وتجنب المزالق الشائعة.

سجل الان

على قدم المساواة مع LLMs التكنولوجيا الكبيرة

تدعي Got It AI أن ELMAR تقدم العديد من الفوائد للمؤسسات التي تسعى إلى دمج نموذج لغوي. أولاً ، نظرًا لحجمها الصغير ، فإن الأجهزة المطلوبة لتشغيل ELMAR أقل تكلفة بكثير من تلك المطلوبة لـ OpenAI’s GPT-4. علاوة على ذلك ، يسمح ELMAR بضبط مجموعة البيانات المستهدفة ، مما يلغي الحاجة إلى النماذج المكلفة القائمة على واجهة برمجة التطبيقات ومنع حدوث زيادة في تكاليف الاستدلال.

قال ريلان لموقع VentureBeat: “نحن لا نقول إن هناك حاجة إلى نماذج قوية جدًا”. “نحن نقول إن كل هذه القوة ليست ضرورية لحالات ومتطلبات استخدام المؤسسات الرئيسية.”

مصدر الصورة: Got It AI

لتعزيز المحادثة المحيطة بدقة نماذج اللغة ، قامت Got It AI بمقارنة ELMAR بـ ChatGPT و GPT-3 و GPT-4 و GPT-J / Dolly و Meta LLaMA و Stanford’s Alpaca في دراسة لقياس معدلات الهلوسة. أوضحت الدراسة كيف يمكن لـ LLM أصغر حجمًا ومضبوطًا أن يؤدي أيضًا أداءً جيدًا في حالات الاستخدام المستندة إلى الحوار في مجموعة اختبار مكونة من 100 مادة متاحة الآن لمختبري الإصدارات التجريبية.

“مؤخرًا ، تم اقتراح أن الطرز الأصغر والأقدم مثل GPT-J يمكنها تقديم تجارب شبيهة بـ ChatGPT. في تجاربنا ، لم نجد هذا هو الحال. قال شاندرا خاتري ، رئيس أبحاث الذكاء الاصطناعي للمحادثة وأحد مؤسسي Got It AI ، على الرغم من الضبط الدقيق ، كان أداء هذه النماذج أسوأ بكثير من النماذج الأخرى الأكثر تقدمًا. “لا يتعلق الأمر بالبيانات فحسب ، بل يتعلق أيضًا بهياكل النماذج الحديثة وتقنيات التدريب.”

في وقت سابق من شهر كانون الثاني (يناير) ، طورت الشركة ما أطلقوا عليه “TruthChecker” ، وهو معالج لاحق تم ضبطه بدقة يعتمد على نموذج اللغة ، والذي يقارن الاستجابات الناتجة عن أي نموذج لغة بالحقيقة الأساسية في مجموعة البيانات المستهدفة ويظهر ما يبدو أنه غير صحيح ، إجابات مضللة أو غير كاملة ؛ ظاهرة تعرف باسم “الهلوسة”.

كشفت دراسة Got It AI أن LLM أصغر حجمًا مفتوح المصدر يؤدي أداءً ضعيفًا في مهام محددة ما لم يتم ضبطها بدقة على مجموعات البيانات المستهدفة.

“عندما استخدمنا Alpaca ، وهو نموذج مفتوح المصدر ، لمهمة أسئلة وأجوبة على 100 مقالة هدفنا ، نتج عن ذلك جزء كبير من الإجابات غير صحيحة أو هلوسة ، ولكن كان أداءها أفضل بعد الضبط الدقيق. من ناحية أخرى ، عند ضبط ELMAR على نفس مجموعة البيانات ، ينتج عن ذلك نتائج دقيقة تعادل ChatGPT-3 “.

حسنًا ، مقارنة معدل الهلوسة بالذكاء الاصطناعي. مصدر الصورة: Got It AI

قال ريلان: “لقد اخترنا نهجنا ليكون نموذجًا وتدريبًا وبيانات ELMAR غير مقيدة بتراخيص نماذج وبيانات LLaMA و Alpaca”. “لم يكن من السهل. كان علينا ربط الإبرة ثم إيجاد التركيبة الصحيحة من النموذج القابل للتسويق وتقنيات التدريب والبيانات “.

أصبح ملعب TruthChecker Playground متاحًا الآن للمستخدمين لتقييم وظائف الذكاء الاصطناعي.

تمكين الأعمال بتحكم أكبر في ماجستير إدارة الأعمال

يتيح نموذج اللغة ELMAR من Got It AI للشركات تكوين معالجاتها المسبقة وتخطيط الإجراءات لتأمين بنية نموذج اللغة الخاصة بهم ضد الهجمات.

قال ريلان لـ VentureBeat: “سيتم ضبط المعالج المسبق وتهيئته والتحكم فيه من قبل المؤسسة”. “لذلك يضع المستخدم المؤسسي سياساته لإزالة البيانات ، مثل معلومات التعريف الشخصية (PII).”

تم وضع نموذج ELMAR في خطواته مقابل العديد من قواعد المعرفة مثل Zendesk و Confluence ، بالإضافة إلى مستندات PDF كبيرة الحجم.

بعد ملاحظات ألفا الناجحة ، تخطط Got It AI لبدء برنامج ELMAR التجريبي قريبًا مع رواد المؤسسات عبر العديد من الصناعات وتلقي التعليقات حول أنواع “المحاذاة” قبل المعالجة والمعالجة اللاحقة التي تعمل في جميع الصناعات ، مقابل تلك الصناعية أو الصناعية. خاص بالمؤسسة.

تهدف الشركة إلى تحسين سرعة ELMAR ودقتها وفعاليتها من حيث التكلفة للتدريب ، مع خطط لتوسيع نطاق دورة ما بعد الإصدار التجريبي من النموذج. قال ريلان: “هناك الكثير من العمل في المستقبل”.

مهمة VentureBeat هو أن تكون ساحة المدينة الرقمية لصناع القرار التقنيين لاكتساب المعرفة حول تكنولوجيا المؤسسات التحويلية والمعاملات. اكتشف إحاطاتنا.


اكتشاف المزيد من موقع شبرون

اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.

Comments

No comments yet. Why don’t you start the discussion?

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *