Google Deepmind lance deux nouveaux modèles d’IA conçus pour aider les robots ÖR à exposer des tâches réelles plus larges que jamais. Le premier appelé Gemini Robotics est un modèle d’action en vision qui peut comprendre de nouvelles situations, même si elles ne sont pas formées sur eux.

Gemini Robotics est basé sur Gemini 2.0, la dernière version de l’IA phare de Google. Lors d’un point de presse, Carolina Parada, directrice principale robotique et présidente de Google Deepmind, a déclaré que Gemini Robotics a déclaré que « Gemini bénéficiait de la compréhension du monde multi-modéré et transférait les actions physiques comme une nouvelle méthode ».

Le nouveau modèle fait des progrès dans trois domaines clés dans lesquels Google Deepmind dit qu’il est nécessaire de créer des robots utiles: généralité, interaction et dextérité. En plus de la capacité de généraliser de nouveaux scénarios, les jumeaux sont meilleurs dans l’interaction de la robotique avec les gens et leur environnement. Il peut également effectuer des tâches physiques plus sensibles telles que le pliage d’un morceau de papier ou le retrait d’un couvercle de bouteille.

« Bien que nous ayons fait des progrès individuellement avec la robotique générale dans chacune de ces domaines dans le passé, nous apportons des performances croissantes avec un seul modèle (dans une large mesure) dans les trois domaines », a-t-il déclaré. «Cela nous permet de créer des robots plus talentueux, plus sensibles et plus robustes aux changements dans leur environnement.»

Google Deepmind lance également Gemini Robotics -er (ou raisonnement incarné), que l’entreprise décrit comme un modèle de langage visuel avancé, qui est un « monde complexe et dynamique ».

Comme Parada l’a expliqué, lorsque vous emballez une boîte à lunch et qu’il y a des articles à une table devant vous, vous devez savoir où tout est et comment ouvrir la boîte à lunch, comment comprendre les articles et où placer. Gemini Robotics devrait faire. Conçu pour que les roboticiens se connectent avec les contrôleurs de bas niveau actuels – le système de système qui contrôle les mouvements d’un robot leur permet d’activer de nouvelles capacités renforcées par la robotique-ERM.

En termes de sécurité, le chercheur de Google Deepmind, Vikas Sindhwani, a déclaré aux journalistes que la société avait développé une «approche de couche, et que les modèles Gemini Robotics-eer avaient été éduqués pour évaluer si une action potentielle peut être effectuée dans un scénario spécifique». La société publie également de nouveaux critères et cadres pour aider à poursuivre la recherche en matière de sécurité dans l’industrie de l’IA. L’année dernière, Google Deepmind a présenté un certain nombre d’Isaac Asimov, inspiré d’une série d’Isaac Asimov pour ses robots.

Google DeepMind travaille avec Apptrronics pour « créer une nouvelle génération de robots humanoïdes ». En outre, l’accès des «experts en test de confiance» Gémeaux au modèle robotique-ER. Robots agilesRobots d’agilité, dynamique de Boston et Véhicules magiques. MAK Nous nous sommes concentrés sur la construction de l’intelligence, qui peut comprendre le monde physique et agir dans ce monde physique, Mak a déclaré l’argent. «Fondamentalement, nous sommes plus heureux de bénéficier de plusieurs réglementations et de nombreuses applications pour nous.»

Lien source