نظرة عامة
تنظيم صفحاتك في مجموعات
يمكنك حفظ المحتوى وتصنيفه حسب إعداداتك المفضّلة.
شهدت السنوات القليلة الماضية ارتفاعًا في طبقات الرسومات الجديدة القابلة للتفاضل والتي يمكن إدراجها في بنيات الشبكات العصبية. من المحولات المكانية إلى عارضين الرسومات التفاضلية ، تستفيد هذه الطبقات الجديدة من المعرفة المكتسبة على مدار سنوات من رؤية الكمبيوتر وأبحاث الرسومات لبناء هياكل شبكات جديدة وأكثر كفاءة. تفتح النمذجة الهندسية المسبقة والقيود في الشبكات العصبية الباب أمام البنى التي يمكن تدريبها بقوة وكفاءة والأهم من ذلك ، بطريقة تخضع للإشراف الذاتي.
على مستوى عالٍ ، يتطلب خط أنابيب رسومات الكمبيوتر تمثيلًا للأشياء ثلاثية الأبعاد وتحديد موضعها المطلق في المشهد ووصفًا للمادة المكونة منها والأضواء والكاميرا. يتم بعد ذلك تفسير وصف المشهد هذا بواسطة العارض لإنشاء عرض تركيبي.
وبالمقارنة ، فإن نظام رؤية الكمبيوتر سيبدأ من صورة ويحاول استنتاج معلمات المشهد. يسمح هذا بالتنبؤ بالأشياء الموجودة في المشهد ، والمواد التي تتكون منها ، والموضع والاتجاه ثلاثي الأبعاد.

غالبًا ما يتطلب تدريب أنظمة التعلم الآلي القادرة على حل مهام الرؤية ثلاثية الأبعاد المعقدة كميات كبيرة من البيانات. نظرًا لأن تصنيف البيانات عملية مكلفة ومعقدة ، فمن المهم أن يكون لديك آليات لتصميم نماذج التعلم الآلي التي يمكنها فهم العالم ثلاثي الأبعاد أثناء التدريب دون الكثير من الإشراف. يوفر الجمع بين رؤية الكمبيوتر وتقنيات رسومات الكمبيوتر فرصة فريدة للاستفادة من الكميات الهائلة من البيانات غير الموسومة والمتاحة بسهولة. كما هو موضح في الصورة أدناه ، يمكن تحقيق ذلك ، على سبيل المثال ، باستخدام التحليل عن طريق التوليف حيث يستخرج نظام الرؤية معلمات المشهد ويعيد نظام الرسوم صورة بناءً عليها. إذا تطابق العرض مع الصورة الأصلية ، فإن نظام الرؤية قد استخرج بدقة معلمات المشهد. في هذا الإعداد ، تسير رؤية الكمبيوتر ورسومات الكمبيوتر جنبًا إلى جنب ، مما يشكل نظامًا واحدًا للتعلم الآلي مشابهًا لجهاز التشفير التلقائي ، والذي يمكن تدريبه بطريقة ذاتية الإشراف.

يتم تطوير Tensorflow Graphics للمساعدة في معالجة هذه الأنواع من التحديات وللقيام بذلك ، فهي توفر مجموعة من طبقات الرسومات والهندسة المتمايزة (مثل الكاميرات ونماذج الانعكاس والتحولات المكانية والتلافيف الشبكية) ووظائف العارض ثلاثي الأبعاد (مثل 3D TensorBoard) يمكن استخدامها لتدريب نماذج التعلم الآلي التي تختارها وتصحيحها.
إنّ محتوى هذه الصفحة مرخّص بموجب ترخيص Creative Commons Attribution 4.0 ما لم يُنصّ على خلاف ذلك، ونماذج الرموز مرخّصة بموجب ترخيص Apache 2.0. للاطّلاع على التفاصيل، يُرجى مراجعة سياسات موقع Google Developers. إنّ Java هي علامة تجارية مسجَّلة لشركة Oracle و/أو شركائها التابعين.
تاريخ التعديل الأخير: 2025-07-25 (حسب التوقيت العالمي المتفَّق عليه)
[null,null,["تاريخ التعديل الأخير: 2025-07-25 (حسب التوقيت العالمي المتفَّق عليه)"],[],[],null,["# Overview\n\n\u003cbr /\u003e\n\nThe last few years have seen a rise in novel differentiable graphics layers\nwhich can be inserted in neural network architectures. From spatial transformers\nto differentiable graphics renderers, these new layers leverage the knowledge\nacquired over years of computer vision and graphics research to build new and\nmore efficient network architectures. Explicitly modeling geometric priors and\nconstraints into neural networks opens up the door to architectures that can be\ntrained robustly, efficiently, and more importantly, in a self-supervised\nfashion.\n\nAt a high level, a computer graphics pipeline requires a representation of 3D\nobjects and their absolute positioning in the scene, a description of the\nmaterial they are made of, lights and a camera. This scene description is then\ninterpreted by a renderer to generate a synthetic rendering. \n\nIn comparison, a computer vision system would start from an image and try to\ninfer the parameters of the scene. This allows the prediction of which objects\nare in the scene, what materials they are made of, and the three-dimensional\nposition and orientation. \n\nTraining machine learning systems capable of solving these complex 3D vision\ntasks most often requires large quantities of data. As labelling data is a\ncostly and complex process, it is important to have mechanisms to design machine\nlearning models that can comprehend the three dimensional world while being\ntrained without much supervision. Combining computer vision and computer\ngraphics techniques provides a unique opportunity to leverage the vast amounts\nof readily available unlabelled data. As illustrated in the image below,\nthis can, for instance, be achieved using analysis by synthesis where the vision\nsystem extracts the scene parameters and the graphics system\nrenders back an image based on them. If the rendering matches the original\nimage, the vision system has accurately extracted the scene parameters. In this\nsetup, computer vision and computer graphics go hand in hand, forming a single\nmachine learning system similar to an autoencoder, which can be trained in a\nself-supervised manner. \n\nTensorflow Graphics is being developed to help tackle these types of challenges\nand to do so, it provides a set of differentiable graphics and geometry layers\n(e.g. cameras, reflectance models, spatial transformations, mesh convolutions)\nand 3D viewer functionalities (e.g. 3D TensorBoard) that can be used to train\nand debug your machine learning models of choice."]]