شركة تقوم بصنع تطبيق الذكاء الاصطناعي رسم ثلاثي الأبعاد
تطبيق الذكاء الاصطناعي رسم ثلاثي الأبعاد عبر شركة أوبن أي نرصده لكم في هذا المقال حتى تثنى للجميع معرفة ومواكبة التكنولوجيا؟
قد يكون الاختراق التالي لأخذ عالم الذكاء الاصطناعي عن طريق العاصفة هو مولدات النماذج ثلاثية الأبعاد. هذا الأسبوع ، فتح OpenAI مصدر Point-E، وهو نظام تعلم آلي يقوم بإنشاء كائن ثلاثي الأبعاد في حالة مطالبة نصية.
وفقًا لورقة نُشرت جنبًا إلى جنب مع قاعدة الكود ، يمكن لـ Point-E إنتاج نماذج ثلاثية الأبعاد في دقيقة إلى دقيقتين على وحدة معالجة رسومات Nvidia V100 واحدة.
لا تنشئ Point-E كائنات ثلاثية الأبعاد بالمعنى التقليدي. بدلاً من ذلك ، فإنه يُنشئ غيوم نقطية، أو مجموعات منفصلة من نقاط البيانات في الفضاء والتي تمثل شكلاً ثلاثي الأبعاد – ومن هنا جاء الاختصار الخفيف.
(يشير الحرف “E” في Point-E إلى “الكفاءة” ، لأنه ظاهريًا أسرع من الأساليب السابقة لتوليد العناصر ثلاثية الأبعاد.)
من السهل تجميع السحب النقطية من وجهة نظر حسابية ، ولكنها لا تلتقط دقة الكائن الشكل أو الملمس – أحد القيود الرئيسية على Point-E حاليًا.
تطبيق الذكاء الاصطناعي في التعليم
للتغلب على هذا القيد ، قام فريق Point-E بتدريب نظام ذكاء اصطناعي إضافي لتحويل السحب النقطية في Point-E إلى شبكات.
الشبكات – مجموعات الرؤوس والحواف والوجوه التي تحدد كائنًا – تُستخدم بشكل شائع في النمذجة والتصميم ثلاثي الأبعاد.
لكنها لاحظت في الورقة أن النموذج قد يفقد أحيانًا أجزاء معينة من الكائنات، مما يؤدي إلى أشكال ممتلئة أو مشوهة.
خارج نموذج توليد الشبكة، الذي يقف بمفرده ، يتكون Point-E من نموذجين: نموذج نص إلى صورة ونموذج صورة إلى ثلاثي الأبعاد.
تم تدريب نموذج تحويل النص إلى صورة ، على غرار أنظمة الفن التوليدي مثل DALL-E 2 الخاص بـ OpenAI و Stable Diffusion ، على الصور المصنفة لفهم الارتباطات بين الكلمات والمفاهيم المرئية.
من ناحية أخرى ، تم تغذية نموذج الصورة إلى ثلاثية الأبعاد بمجموعة من الصور المقترنة بكائنات ثلاثية الأبعاد حتى يتعلم الترجمة بشكل فعال بين الاثنين.
أمثلة على الذكاء الصناعي
عند إعطاء مطالبة نصية – على سبيل المثال ، “ترس ثلاثي الأبعاد قابل للطباعة ، ترس واحد بقطر 3 بوصات وسمك نصف بوصة” – يُنشئ نموذج تحويل النص إلى صورة في Point-E كائنًا اصطناعيًا يتم تغذيته بالصورة إلى نموذج ثلاثي الأبعاد ، والذي يقوم بعد ذلك بإنشاء سحابة نقطية.
بعد تدريب النماذج على مجموعة بيانات تتكون من “عدة ملايين” من الكائنات ثلاثية الأبعاد والبيانات الوصفية المرتبطة بها ، يمكن أن ينتج Point-E غيوم نقطية ملونة تتطابق بشكل متكرر مع مطالبات النص ، كما يقول باحثو OpenAI.
إنها ليست مثالية – يفشل نموذج Point-E’s image-to-3D في بعض الأحيان في فهم الصورة من نموذج تحويل النص إلى صورة ، مما ينتج عنه شكل لا يتطابق مع موجه النص. ومع ذلك ، فهي أسرع من أحدث التقنيات السابقة – على الأقل وفقًا لفريق أوبن إيه آي.
أقرأ: فوائد الذكاء الاصطناعي في حياتنا اليومية يجهلها الكثير – 20 دليل يؤكد ذلك
وكتبوا في الورقة البحثية: “بينما تؤدي طريقتنا أداء أسوأ في هذا التقييم من التقنيات الحديثة ، إلا أنها تنتج عينات في جزء صغير من الوقت”. “قد يجعل هذا الأمر أكثر عملية لتطبيقات معينة ، أو قد يسمح باكتشاف كائن ثلاثي الأبعاد عالي الجودة.”
ما هي هذه البرامج؟
ما هي التطبيقات بالضبط؟ حسنًا ، أشار باحثو OpenAI إلى أنه يمكن استخدام السحب النقطية لـ Point-E لتصنيع كائنات العالم الحقيقي ، على سبيل المثال من خلال الطباعة ثلاثية الأبعاد.
مع نموذج التحويل الشبكي الإضافي ، يمكن للنظام – بمجرد أن يصبح أكثر صقلًا – أن يجد طريقه أيضًا إلى سير عمل تطوير الألعاب والرسوم المتحركة.
قد تكون شركة OpenAI هي أحدث شركة تقفز إلى معركة منشئ تطبيق الذكاء الاصطناعي رسم ثلاثي الأبعاد ، ولكنها – كما أشرنا سابقًا – ليست الأولى بالتأكيد.
في وقت سابق من هذا العام ، أصدرت Google DreamFusion ، وهو نسخة موسعة من Dream Fields ، وهو نظام ثلاثي الأبعاد تم الكشف عنه في عام 2021.
على عكس Dream Fields ، لا يتطلب DreamFusion أي تدريب مسبق ، مما يعني أنه يمكنه إنشاء تمثيلات ثلاثية الأبعاد للكائنات بدون بيانات ثلاثية الأبعاد.
في الوقت الذي تتجه فيه كل الأنظار إلى المولدات الفنية ثنائية الأبعاد في الوقت الحالي ، يمكن أن يكون الذكاء الاصطناعي المركب للنماذج هو المسبب التالي للصناعة الكبيرة.
تستخدم النماذج ثلاثية الأبعاد على نطاق واسع في السينما والتلفزيون والتصميم الداخلي والهندسة المعمارية ومجالات العلوم المختلفة.
تستخدمها الشركات المعمارية لعرض المباني والمناظر الطبيعية المقترحة ، على سبيل المثال ، بينما يستفيد المهندسون من النماذج كتصميمات للأجهزة والمركبات والهياكل الجديدة.
هل يحتاج تطبيق الذكاء الاصطناعي رسم ثلاثي 3D إلى وقت؟
عادةً ما تستغرق النماذج ثلاثية الأبعاد بعض الوقت في التصنيع – في أي مكان يتراوح بين عدة ساعات إلى عدة أيام. يمكن للذكاء الاصطناعي مثل Point-E تغيير ذلك إذا تم حل مكامن الخلل يومًا ما ، وجعل OpenAI ربحًا محترمًا عند القيام بذلك.
السؤال هو ما نوع نزاعات الملكية الفكرية التي قد تنشأ في الوقت المناسب. هناك سوق كبير للنماذج ثلاثية الأبعاد .
مع العديد من الأسواق عبر الإنترنت بما في ذلك CGStudio و CreativeMarket مما يسمح للفنانين ببيع المحتوى الذي قاموا بإنشائه.
إذا استطاعت Point-E أن تشق طريقها ونماذجها إلى الأسواق ، فقد يحتج فنانون النماذج ، مشيرين إلى أدلة على أن الذكاء الاصطناعي التوليدي الحديث يقترض بشكل كبير من بيانات التدريب الخاصة به – النماذج ثلاثية الأبعاد الحالية ، في حالة Point-E.
مثل DALL-E 2 ، لا تنسب Point-E أو تقتبس أيًا من الفنانين الذين ربما أثروا في أجيالها.
لكن شركة OpenAI ستترك هذه القضية ليوم آخر. لم تذكر ورقة Point-E أو صفحة GitHub أي ذكر لحقوق النشر في تطبيق الذكاء الاصطناعي رسم ثلاثي الأبعاد.
يُحسب للباحثين أنهم يتوقعون أن تعاني Point-E من مشاكل أخرى، مثل التحيزات الموروثة من بيانات التدريب ونقص الضمانات حول النماذج التي يمكن استخدامها لإنشاء “أشياء خطيرة”.
ربما لهذا السبب هم حريصون على وصف Point-E على أنها “نقطة انطلاق” يأملون أن تلهم “مزيدًا من العمل” في مجال توليف النص إلى ثلاثي الأبعاد.