أعلنت شركة OpenAI الشركة الناشئة في مجال الذكاء الاصطناعي والتي أسسها إيلون ماسك، والتي تقف وراء مولد النصوص إلى الصور الشهير باسم Dall-E عن إطلاق نظام إنشاء الصور ثلاثية الأبعاد تحت اسم POINT-E وهو نظام يسمح لك بإنتاج نماذج ثلاثية الأبعاد مباشرة من الرسائل النصية.
وفي الوقت الذي تتطلب فيه الأنظمة الحالية مثل DreamFusion عادة عدة ساعات لإنشاء الصور، فإن نظام Point-E تحتاج فقط إلى وحدة معالجة مركزية واحدة فقط ودقيقتين على الأكثر لإتمام ذلك.
وتستخدم النمذجة ثلاثية الأبعاد عبر مجموعة متنوعة من الصناعات والتطبيقات، وتعتمد تأثيرات CGI للأفلاح الحديثة وألعاب الفيديو والواقع الافتراضي والواقع المعزز ومهام رسم الخرائط التابعة لناسا ومشاريع الحفاظ على مواقع التراث من جوجل ورؤية ميتا للميتافيرس على إمكانات النمذجة ثلاثية الأبعاد.
- اقرأ أيضاً: ما هو ChatGPT وهل يمكن أن ينافس جوجل مستقبلًا؟
.ومع ذلك، فإن إنشاء صور ثلاثية الأبعاد الواقعية لا يزال يحتاج إلى موارد قوية وتستغرق وقتًا طويلًا للإنتاج، على الرغم من عمل إنفيديا لأتمتة إنشاء الكائنات وتطبيق RealityCapture للهاتف المحمول من شركة Epic للألعاب، والذي يسمح لأي شخص لديه هاتف iOS بعمل مسح لكائنات العالم الحقيقي كصور ثلاثية الأبعاد.
وقد اكتسبت أنظمة تحويل النص إلى صورة مثل DALL-E 2 و Craiyon و DeepAI Prisma Lab شعبية وشهرة في السنوات الأخيرة، وتعد مهمة تحويل النصوص إلى صور ثلاثية الأبعاد من أهم النقاط.
وعلى عكس الأنظمة المماثلة، يستفيد نظام Point-E من مجموعة كبيرة من النصوص والصور، ويسمح لهم باتباع المطالبات المتنوعة والمعقدة، بينما يتم تدريب نموذج الصورة إلى هيكل ثلاثي أبعاد اعتمادًا على مجموعة بيانات أصغر، وقد تم تدريب هذه الأنظمة على ملايين النماذج ثلاثية الأبعاد، وتم تحويلها جميعًا إلى تنسيق موحد، وتنتج هذه الأنظمة عينات في جزء صغير من الوقت.