Jannah Theme License is not validated, Go to the theme options page to validate the license, You need a single license for each domain name.
مقالات التقنية

قاعدة بيانات المتجه هي نوع جديد من قواعد البيانات لعصر الذكاء الاصطناعي


تحقق من جميع الجلسات عند الطلب من قمة الأمن الذكي هنا.


تدرك الشركات في كل صناعة بشكل متزايد أن اتخاذ قرارات تعتمد على البيانات أمر ضروري للمنافسة الآن ، في السنوات الخمس المقبلة ، في العشرين القادمة وما بعدها. نمو البيانات – نمو البيانات غير المهيكلة على وجه الخصوص – خارج المخططات ، وتقدر أبحاث السوق الحديثة أن سوق الذكاء الاصطناعي العالمي (AI) ، المدعوم بالبيانات ، “سيتوسع بمعدل نمو سنوي مركب (CAGR) يبلغ 39.4٪ ليصل إلى 422.37 دولارًا أمريكيًا” مليار بحلول عام 2028. ” ليس هناك عودة عن غمر البيانات وعصر الذكاء الاصطناعي الذي علينا.

ضمنيًا في هذا الواقع هو أن الذكاء الاصطناعي يمكنه فرز ومعالجة تدفق البيانات بشكل هادف – ليس فقط لعمالقة التكنولوجيا مثل Alphabet و Meta و Microsoft من خلال عمليات البحث والتطوير الضخمة وأدوات الذكاء الاصطناعي المخصصة ، ولكن للمؤسسات المتوسطة وحتى الشركات الصغيرة والمتوسطة.

تعمل التطبيقات القائمة على الذكاء الاصطناعي المصممة جيدًا على التدقيق في مجموعات البيانات الكبيرة للغاية بسرعة كبيرة لتوليد رؤى جديدة وتشغيل تدفقات إيرادات جديدة في نهاية المطاف ، وبالتالي خلق قيمة حقيقية للشركات. ولكن لا يتم تفعيل أي من نمو البيانات وإضفاء الطابع الديمقراطي عليه بدون الطفل الجديد في الكتلة: قواعد بيانات المتجهات. هذه علامة على فئة جديدة من إدارة قواعد البيانات وتحول نموذجي للاستفادة من الأحجام الأسية للبيانات غير المهيكلة الموجودة غير المستغلة في مخازن الكائنات. توفر قواعد بيانات المتجهات مستوى جديدًا مذهلاً من القدرة على البحث عن البيانات غير المهيكلة على وجه الخصوص ، ولكن يمكنها أيضًا معالجة البيانات شبه المنظمة وحتى المنظمة.

البيانات غير المنظمة – مثل الصور والفيديو والصوت وسلوكيات المستخدم – لا تتناسب بشكل عام مع نموذج قاعدة البيانات العلائقية ؛ لا يمكن فرزها بسهولة في علاقات الصفوف والأعمدة. غالبًا ما تتلخص طرق إدارة البيانات غير المهيكلة ، التي تستغرق وقتًا طويلاً ، والتي يتم التغلب عليها أو تفويتها ، في وضع علامات على البيانات يدويًا (فكر في التسميات والكلمات الرئيسية على منصات الفيديو).

حدث

قمة الأمن الذكي عند الطلب

تعرف على الدور الحاسم للذكاء الاصطناعي وتعلم الآلة في الأمن السيبراني ودراسات الحالة الخاصة بالصناعة. شاهد الجلسات عند الطلب اليوم.

مشاهدة هنا

يمكن أن تكون العلامات مليئة بالتصنيفات والعلاقات غير الواضحة. يفسح وضع العلامات اليدوي نفسه للبحث المعجمي التقليدي الذي يطابق الكلمات والنصوص تمامًا. لكن البحث الدلالي الذي يفهم معنى وسياق صورة أو جزء آخر من البيانات غير المنظمة ، بالإضافة إلى استعلام البحث ، يكاد يكون مستحيلًا مع العمليات اليدوية.

أدخل نواقل التضمين ، وتسمى أيضًا حفلات الزفاف المتجهة ، أو ناقلات السمات ، أو مجرد حفلات الزفاف. إنها قيم عددية – إحداثيات أنواع – تمثل كائنات أو ميزات بيانات غير منظمة ، مثل مكون من صورة ، أو جزء من ملف تعريف شراء الشخص ، أو تحديد إطارات في مقطع فيديو ، أو بيانات جغرافية مكانية أو أي عنصر لا يتناسب تمامًا مع جدول قاعدة البيانات العلائقية. تجعل هذه الزخارف “بحث التشابه” القابل للتطوير في جزء من الثانية ممكنًا. هذا يعني العثور على عناصر مماثلة بناءً على أقرب تطابق.

بيانات الجودة – والرؤى

تنشأ عمليات التضمين بشكل أساسي كمنتج ثانوي حسابي لنموذج الذكاء الاصطناعي ، أو بشكل أكثر تحديدًا ، نموذجًا للتعلم الآلي أو العميق يتم تدريبه على مجموعات كبيرة جدًا من بيانات الإدخال عالية الجودة. لتقسيم الشعيرات المهمة بشكل أكبر قليلاً ، يكون النموذج هو الناتج الحسابي لخوارزمية التعلم الآلي (ML) (طريقة أو إجراء) تعمل على البيانات. تتضمن الخوارزميات المتطورة والمستخدمة على نطاق واسع STEGO للرؤية الحاسوبية و CNN لمعالجة الصور و Google BERT لمعالجة اللغة الطبيعية. تقوم النماذج الناتجة بتحويل كل قطعة مفردة من البيانات غير المهيكلة إلى قائمة بقيم الفاصلة العائمة – التضمين الذي يتيح البحث لدينا.

لذلك ، فإن نموذج الشبكة العصبية المدرب جيدًا سينتج حفلات الزفاف التي تتوافق مع محتوى معين ويمكن استخدامها لإجراء بحث عن التشابه الدلالي. إن أداة تخزين هذه الزخارف وفهرستها والبحث فيها هي قاعدة بيانات متجهية – مصممة خصيصًا لإدارة حفلات الزفاف وهيكلها المتميز.

ما هو المفتاح في السوق هو أنه يمكن للمطورين في أي مكان الآن إضافة قاعدة بيانات متجه ، بقدراتها الجاهزة للإنتاج والبحث السريع عن البيانات غير المهيكلة ، إلى تطبيقات الذكاء الاصطناعي. هذه تطبيقات قوية يمكن أن تساعد الشركة على تحقيق أهداف أعمالها.

تبدأ إستراتيجية قاعدة بيانات Vector بحالات الاستخدام المنطقية لعملك

من الشائع بشكل متزايد أن تتضمن إستراتيجية البيانات الشاملة للشركة الذكاء الاصطناعي ، ولكن من الضروري التفكير في وحدات الأعمال وحالات الاستخدام التي ستستفيد أكثر. يمكن لتطبيقات الذكاء الاصطناعي المبنية على قواعد بيانات المتجهات تحليل البيانات الضخمة غير المهيكلة لأغراض التسويق والمبيعات والبحث والأمان. تعد أنظمة التوصيات – بما في ذلك توصية المحتوى الذي ينشئه المستخدم ، والبحث المخصص في التجارة الإلكترونية ، وتحليل الفيديو والصور ، والإعلانات الموجهة ، والأمن السيبراني لمكافحة الفيروسات ، وروبوتات الدردشة ذات المهارات اللغوية المحسّنة ، واكتشاف الأدوية ، والبحث عن البروتينات ، واكتشاف مكافحة الاحتيال المصرفي – من بين أولى حالات الاستخدام البارزة تدار بشكل جيد من خلال قواعد بيانات المتجهات بسرعة ودقة.

ضع في اعتبارك سيناريو التجارة الإلكترونية حيث تتوفر مئات الملايين من المنتجات المختلفة. يريد مطور التطبيقات الذي ينشئ محرك توصيات أن يكون قادرًا على التوصية بأنواع جديدة من المنتجات التي تجذب المستهلكين الأفراد. تلتقط عمليات التضمين الملفات الشخصية والمنتجات واستعلامات البحث ، وستؤدي عمليات البحث إلى نتائج أقرب الجيران ، وغالبًا ما تتوافق مع اهتمامات المستهلك بطريقة غريبة تقريبًا.

اختر مصدر مفتوح ومُصمم لغرض معين

قام بعض التقنيين بتوسيع قواعد البيانات العلائقية التقليدية لدعم حفلات الزفاف. لكن هذا النهج الذي يناسب الجميع لإضافة جدول “عمود متجه” غير مُحسَّن لإدارة حفلات الزفاف ، ونتيجة لذلك ، يعاملهم كمواطنين من الدرجة الثانية. تستفيد الشركات من قواعد بيانات المتجه مفتوحة المصدر المصممة لهذا الغرض والتي نضجت إلى الحد الذي تقدم فيه بحثًا عالي الأداء على بيانات متجهية أكبر حجمًا بتكلفة أقل من الخيارات الأخرى.

يجب تصميم قواعد بيانات المتجهات المصممة لهذا الغرض لتدمج بسهولة فهارس جديدة لسيناريوهات التطبيقات الناشئة ودعم التدرج المرن لعقد متعددة لاستيعاب أحجام البيانات المتزايدة باستمرار.

عندما تتبنى الشركات استراتيجية مفتوحة المصدر ، يرى مطوروها كل ما يحدث باستخدام الأداة. لا توجد أسطر مخفية من التعليمات البرمجية. هناك دعم مجتمعي. Milvus ، وهو مشروع Linux Foundation AI والبيانات ، على سبيل المثال ، هو قاعدة بيانات متجهية معروفة ومختارة بين الشركات التي يسهل تجربتها بسبب تطويرها النابض بالحياة مفتوح المصدر. من الأسهل تصور ذلك ضمن نظام بيئي أوسع للذكاء الاصطناعي وبناء أدوات متكاملة له. تجعل العديد من حزم SDK وواجهة برمجة التطبيقات الواجهة بسيطة قدر الإمكان بحيث يمكن للمطورين الانضمام إليها بسرعة وتجربة أفكارهم التي تستفيد من البيانات غير المنظمة.

التغلب على التحديات المقبلة

لا شك أن التكنولوجيا الجديدة الكبيرة التي تغير النموذج تجلب بعض التحديات – التقنية والتنظيمية. يمكن لقواعد بيانات المتجهات البحث عبر مليارات من عمليات التضمين ، وتختلف فهرستها تقنيًا عن تلك الموجودة في قواعد البيانات العلائقية. مما لا يثير الدهشة ، أن تطوير فهارس النواقل يتطلب خبرة متخصصة. قواعد بيانات المتجهات ثقيلة حسابيًا أيضًا ، نظرًا لنشأة الذكاء الاصطناعي والتعلم الآلي. حل التحديات الحسابية على نطاق واسع هو مجال التطوير المستمر.

من الناحية التنظيمية ، تظل مساعدة فرق العمل والقيادة على فهم لماذا وكيف تكون قواعد بيانات المتجهات مفيدة لهم جزءًا أساسيًا من تطبيع استخدامها. البحث المتجه نفسه كان موجودًا منذ فترة طويلة ولكن على نطاق صغير جدًا. العديد من الشركات ليست معتادة حقًا على الوصول إلى نوع البحث عن البيانات وطاقة التعدين التي توفرها قواعد بيانات المتجهات الحديثة. يمكن أن تشعر الفرق بعدم اليقين بشأن من أين تبدأ. لذا فإن إيصال الرسالة حول كيفية عملها ولماذا يجلبون القيمة يظل أولوية قصوى لمنشئيهم.

تشارلز شيه هو الرئيس التنفيذي لشركة Zilliz

صانعي القرار

مرحبًا بك في مجتمع VentureBeat!

DataDecisionMakers هو المكان الذي يمكن للخبراء ، بما في ذلك الأشخاص الفنيون الذين يقومون بعمل البيانات ، مشاركة الأفكار والابتكارات المتعلقة بالبيانات.

إذا كنت تريد أن تقرأ عن الأفكار المتطورة والمعلومات المحدثة ، وأفضل الممارسات ، ومستقبل البيانات وتكنولوجيا البيانات ، انضم إلينا في DataDecisionMakers.

يمكنك حتى التفكير في المساهمة بمقال خاص بك!

قراءة المزيد من DataDecisionMakers

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى