تزود الذكاء الاصطناعي بالوقود 5 ملايين دولار لإنشاء مجموعات بيانات جاهزة للتدريب باستخدام LLMs

تزود الذكاء الاصطناعي بالوقود 5 ملايين دولار لإنشاء مجموعات بيانات جاهزة للتدريب باستخدام LLMs

[ad_1]

انضم إلى كبار المديرين التنفيذيين في سان فرانسيسكو يومي 11 و 12 يوليو ، لمعرفة كيف يدمج القادة استثمارات الذكاء الاصطناعي ويحسنونها لتحقيق النجاح. يتعلم أكثر


شركة Refuel AI ، وهي شركة تستخدم نماذج لغة كبيرة (LLMs) لتوليد بيانات تدريب عالية الجودة لنماذج الذكاء الاصطناعي ، خرجت اليوم من التخفي بمبلغ 5.2 مليون دولار من التمويل الأولي. وقالت الشركة إنها ستستخدم الجولة لتنمية فريقها وبناء قدرات منصتها ، وإعدادها للإطلاق التجاري في يوليو.

أسسها خريجو جامعة ستانفورد Nihit Desai و Rishabh Bhargava ، وقد فتحت Refuel أيضًا الوصول إلى AutoLabel ، وهي مكتبة مفتوحة المصدر تسهل على أي فريق AI تسمية بياناتهم في بيئتهم الخاصة ومع أي ماجستير يريدونه.

>> لا تفوّت إصدارنا الخاص: بناء الأساس لجودة بيانات العملاء. <<

تأتي العروض كإجابة على تحديات البيانات التي تبطئ تطوير الذكاء الاصطناعي ، وتمنع الشركات من تضمين تكنولوجيا الجيل التالي في منتجاتها ووظائفها التجارية.

حدث

تحويل 2023

انضم إلينا في سان فرانسيسكو يومي 11 و 12 يوليو ، حيث سيشارك كبار المسؤولين التنفيذيين في كيفية دمج استثمارات الذكاء الاصطناعي وتحسينها لتحقيق النجاح وتجنب المزالق الشائعة.

سجل الان

تحتاج كل شركة من شركات الذكاء الاصطناعي إلى بيانات جاهزة للذكاء الاصطناعي

اليوم ، تتسابق كل شركة لتصبح شركة ذكاء اصطناعي ، وتعمل مع خبراء داخليين وبائعين خارجيين لتطوير نماذج قادرة على استهداف حالات استخدام مختلفة خاصة بالأعمال. قد تكون المهمة صعبة للغاية ، لكن كل مشروع ذكاء اصطناعي له نفس نقطة البداية: بيانات نظيفة ومُصنَّفة. إذا تم ذلك بشكل صحيح ، يمكن أن يبدأ المشروع بسهولة.

الآن ، في حين أن الشركات لديها الكثير من البيانات تحت تصرفها ، إلا أنها ليست كلها جاهزة للتدريب افتراضيًا. يجب تنظيف المعلومات والتعليق عليها لتدريب النموذج – وهي مهمة يتم التعامل معها عادةً بواسطة فرق بشرية وتستغرق أسابيع إلى شهور. هذا فقط لا يتناسب مع متطلبات الذكاء الاصطناعي اليوم.

“العديد من الفرق [we spoke to] كانت لديهم كل هذه الأفكار الرائعة للنماذج التي أرادوا تدريبها والمنتجات التي أرادوا بناءها – فقط إذا كانت لديهم البيانات جاهزة للتدريب. كان ذلك عندما علمنا أن إتاحة البيانات النظيفة والمُصنفة بسرعة الفكر هو ما أردنا التركيز عليه ، “قال بهارجافا لموقع VentureBeat.

لذلك ، في عام 2021 ، بدأ الثنائي Refuel واستمروا في بناء منصة مخصصة تستخدم LLMs المتخصصة لأتمتة إنشاء مجموعات البيانات ووسمها (بجودة متساوية مع أو أفضل من البشر) لكل عمل وكل حالة استخدام.

وفقًا للشركة ، سيتمكن مستخدمو المؤسسة من استخدام النظام الأساسي ببساطة عن طريق تحميل مجموعات البيانات الخاصة بهم وتوجيه LLMs لتسمية البيانات. يمكنهم أيضًا تقديم إرشادات وبعض الأمثلة لضمان إصدار بيانات عالية الجودة وجاهزة للتدريب فقط.

“في غضون ساعة ، سيكون لديهم (المستخدمون) بيانات كافية لبدء تدريب نماذج الذكاء الاصطناعي الخاصة بهم ، والتي يمكنهم بعد ذلك توصيلها بسلاسة بالبنية التحتية التدريبية النموذجية الخاصة بهم. وأضاف الرئيس التنفيذي أنه نظرًا لأن هذه الفرق تجمع المزيد من البيانات (خاصة من الإنتاج) ، فيمكنها إعادة توجيهها إلى إعادة التزود بالوقود من أجل وضع العلامات وقياس الأداء وتحسين مجموعات البيانات الخاصة بهم لإعادة تدريب النموذج “.

في الاختبارات التجريبية الخاصة التي أجرتها شركات مختارة ، تم العثور على العرض لتسريع عملية إنشاء البيانات ووضع العلامات بنسبة تصل إلى 100٪. لم تشارك Bhargava أسماء هذه الشركات لكنها أشارت إلى أن Refuel AI تشهد اهتمامًا من عدة قطاعات ، من وسائل التواصل الاجتماعي والتكنولوجيا المالية إلى الرعاية الصحية والموارد البشرية والتجارة الإلكترونية.

الطريق أمامنا

من خلال هذه الجولة ، التي شارك في قيادتها General Catalyst و XYZ Ventures ، تخطط Refuel لتنمية فريقها الهندسي من ستة إلى 12 عضوًا وزيادة الاستثمار في المنصة وبنيتها التحتية LLM للتحضير لإطلاق تجاري بحلول نهاية يوليو. كما ستستثمر الشركة رأس المال في مكتبتها ومجتمعها مفتوح المصدر.

وأشار بهارجافا ، “كمثال ملموس ، نحن ننظم مسابقة لدفع حدود تصنيف البيانات التي تعمل بنظام LLM ، بجوائز تصل إلى 10000 دولار”.

حاليًا ، في مساحة تسمية البيانات ، تتنافس الشركة مع لاعبين مثل Tasq AI و Snorkel AI و SuperAnnotate.

مهمة VentureBeat هو أن تكون ساحة المدينة الرقمية لصناع القرار التقنيين لاكتساب المعرفة حول تكنولوجيا المؤسسات التحويلية والمعاملات. اكتشف إحاطاتنا.

[ad_2]

Comments

No comments yet. Why don’t you start the discussion?

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *