كيف أصبحت مشكلة معالجة البيانات في Lyft الأساس في نهاية المطاف

متى نهائي كان المؤسسون Sammy Sidhu و Jay Chia يعملان كمهندسين للبرمجيات في برنامج Lyft’s Mostronmous المركبات ، فقد شهدوا مشكلة في البنية التحتية لبيانات التخمير – والتي ستصبح أكبر مع صعود الذكاء الاصطناعي.
تنتج السيارات ذاتية القيادة الكثير من البيانات غير المهيكلة من عمليات الفحص والصور ثلاثية الأبعاد إلى النص والصوت. لم تكن هناك أداة لمهندسي Lyft يمكنهم فهم ومعالجة جميع هذه الأنواع المختلفة من البيانات في نفس الوقت – وكل ذلك في مكان واحد. ترك هذا المهندسين لتجميع أدوات مفتوحة المصدر في عملية طويلة مع مشاكل الموثوقية.
وقال سيدهو ، وهو الرئيس التنفيذي لشركة TechCrunch في مقابلة حديثة: “كان لدينا كل هذه الدكتوراه الرائعة ، والأشخاص الرائعين في جميع أنحاء الصناعة ، والعمل على السيارات المستقلة ، لكنهم ينفقون مثل 80 ٪ من وقتهم في العمل على البنية التحتية بدلاً من بناء تطبيقهم الأساسي”. “ومعظم هذه المشكلات التي يواجهونها كانت حول البنية التحتية للبيانات.”
ساعد Sidhu و Chia في بناء أداة معالجة البيانات متعددة الوسائط الداخلية لـ Lyft. عندما شرع Sidhu في التقدم إلى الوظائف الأخرى ، وجد المقابلات الذين استمروا في سؤاله عن احتمال بناء حل البيانات نفسه لشركاتهم ، وقد ولدت الفكرة وراء النهائي.
قامت في نهاية المطاف ببناء محرك معالجة البيانات المفتوح المصدر Python ، المعروف باسم Daft ، مصمم للعمل بسرعة عبر معارض مختلف من النص إلى الصوت والفيديو ، وأكثر من ذلك. وقال Sidhu إن الهدف هو جعل Daft كبنية تحتية للبيانات غير المهيكلة مثل SQL كانت لمجموعات البيانات الجدولية في الماضي.
تأسست الشركة في أوائل عام 2022 ، قبل ما يقرب من عام قبل إصدار Chatgpt ، وقبل أن يدرك الكثير من الناس فجوة البنية التحتية للبيانات هذه. قاموا بإطلاق أول إصدار مفتوح المصدر من Daft في عام 2022 ويستعدون لإطلاق منتج Enterprise في الربع الثالث.
وقال سيدهو: “إن انفجار chatgpt ، ما رأيناه هو مجرد الكثير من الأشخاص الآخرين الذين يقومون بعد ذلك ببناء تطبيقات الذكاء الاصطناعي بأنواع مختلفة من الطرائق”. “ثم بدأ الجميع في استخدام أشياء مثل الصور والمستندات ومقاطع الفيديو في تطبيقاتهم. وهذا نوع من المكان الذي رأيناه ، زاد الاستخدام بشكل كبير.”
في حين أن الفكرة الأصلية وراء البناء تنبع من مساحة المركبات ذاتية الحكم ، هناك العديد من الصناعات الأخرى التي تعالج البيانات متعددة الوسائط ، بما في ذلك الروبوتات وتقنية البيع بالتجزئة والرعاية الصحية. تعتبر الشركة الآن Amazon و CloudKitchens و Tower AI ، من بين أمور أخرى ، كعملاء.
رفعت في نهاية المطاف مؤخرًا جولتين من التمويل في غضون ثمانية أشهر. الأول كان جولة البذور بقيمة 7.5 مليون دولار بقيادة CRV. في الآونة الأخيرة ، جمعت الشركة جولة بقيمة 20 مليون دولار بقيادة فيليسيس بمشاركة من M12 و Citi من Microsoft.
ستذهب هذه الجولة الأخيرة إلى زيادة عرض المصدر المفتوح في نهاية المطاف بالإضافة إلى إنشاء منتج تجاري يسمح لعملائه ببناء تطبيقات الذكاء الاصطناعى من هذه البيانات المعالجة.
أخبرت أستازيا مايرز ، الشريكة العامة في فيليسيس ، TechCrunch أن تجدها في نهاية المطاف من خلال تمرين رسم الخرائط في السوق والتي تضمنت البحث عن بنية تحتية للبيانات والتي ستكون قادرة على دعم العدد المتزايد لنماذج الذكاء الاصطناعى المتعددة الوسائط.
قال مايرز إن في نهاية المطاف برز لكونه أول محرك في الفضاء – والذي من المحتمل أن يصبح أكثر ازدحامًا – وبناءً على حقيقة أن المؤسسين قد تعاملوا مع مشكلة معالجة البيانات هذه مباشرة. وأضافت أن في نهاية المطاف يحل أيضًا مشكلة متزايدة.
من المتوقع أن تنمو صناعة الذكاء الاصطناعى متعدد الوسائط في أ 35 ٪ معدل نمو سنوي مركب بين عامي 2023 و 2028 ، وفقا لشركة الاستشارات الإدارية MarketSandMarkets.
وقال مايرز: “ارتفع توليد البيانات السنوية 1000x على مدار العشرين عامًا الماضية وتم إنشاء 90 ٪ من بيانات العالم في العامين الماضيين ، ووفقًا لـ IDC ، فإن الغالبية العظمى من البيانات غير منظمة”. “يتناسب Daft مع هذا الاتجاه الكلي الضخم المتمثل في AI التوليدي الذي يتم بناؤه حول النص والصورة والفيديو والصوت. أنت بحاجة إلى محرك معالجة البيانات متعددة الوسائط.”