NVIDIA und Google Cloud arbeiten seit mehr als einem Jahrzehnt zusammen und haben gemeinsam eine Full-Stack-KI-Plattform entwickelt, die alle Technologieebenen umfasst – von leistungsoptimierten Bibliotheken und Frameworks bis hin zu Cloud-Diensten der Unternehmensklasse.
Diese Grundlage ermöglicht es Entwicklern, Startups und Unternehmen, agentische und physische KI aus dem Labor in die Produktion zu bringen – von Agenten, die komplexe Workflows verwalten, bis hin zu Robotern und digitalen Zwillingen in der Fabrikhalle.
Auf der Google Cloud Next in dieser Woche in Las Vegas erreicht die Partnerschaft einen neuen Meilenstein: Mit Weiterentwicklungen zur Erweiterung des Google Cloud AI Hypercomputers für KI-Fabriken wird die nächste Dimension der agentischen und physischen KI vorangetrieben.
Dazu gehören die neuen A5X Bare-Metal-Instanzen auf Basis von NVIDIA Vera Rubin, eine Vorschau von Google Gemini auf Google Distributed Cloud, die auf NVIDIA Blackwell und NVIDIA Blackwell Ultra GPUs ausgeführt wird, vertrauliche VMs mit NVIDIA Blackwell-GPUs und agentische KI auf der Gemini Enterprise Agent Platform mit offenen NVIDIA Nemotron-Modellen und dem NVIDIA NeMo Framework.
Infrastruktur der nächsten Generation: Von NVIDIA Blackwell bis Vera Rubin
Auf der Google Cloud Next hat Google A5X Instanzen auf der Grundlage von NVIDIA Vera Rubin NVL72 Rack-Scale-Systemen angekündigt, die – durch extremes Co-Design über Chips, Systeme und Software hinweg – bis zu 10-mal geringere Inferenzkosten pro Token und einen 10-mal höheren Token-Durchsatz pro Megawatt als die vorherige Generation bieten.
A5X wird NVIDIA ConnectX-9 SuperNICs in Kombination mit Google Virgo-Netzwerken der nächsten Generation nutzen und auf bis zu 80.000 NVIDIA Rubin-GPUs innerhalb eines einzelnen Standort-Clusters und bis zu 960.000 NVIDIA Rubin-GPUs in einem Multi-Site-Cluster skalieren, sodass Kunden ihre größten KI-Workloads auf NVIDIA-optimierter Infrastruktur ausführen können.
„Wir bei Google Cloud sind davon überzeugt, dass das nächste Jahrzehnt der KI durch die Fähigkeit der Kunden bestimmt sein wird, ihre anspruchsvollsten Workloads auf einem wirklich integrierten, KI-optimierten Infrastruktur-Stack auszuführen“, erklärte Mark Lohmeyer, Vice President und General Manager of AI and Computing Infrastructure bei Google Cloud. „Durch die Kombination der skalierbaren Infrastruktur und der verwalteten KI-Dienste von Google Cloud mit den branchenführenden Plattformen, Systemen und Software von NVIDIA bieten wir Kunden die Flexibilität, alles von Frontier-Modellen und offenen Modellen bis hin zu agentischen und physischen KI-Workloads zu trainieren, zu optimieren und bereitzustellen – und gleichzeitig Leistung, Kosten und Nachhaltigkeit zu optimieren.“
Das breite NVIDIA Blackwell-Portfolio von Google Cloud reicht von A4 VMs mit NVIDIA HGX B200-Systemen über A4X VMs im Rack-Scale mit NVIDIA GB200 NVL72 und A4X Max NVIDIA GB300 NVL72 Systemen bis hin zu anteiligen G4 VMs mit NVIDIA RTX PRO 6000 Blackwell Server Edition-GPUs.
Kunden können ihre Beschleunigungskapazitäten richtig dimensionieren, sei es mit mehreren miteinander verbundenen NVL72-Racks, die auf Zehntausende von NVIDIA Blackwell-GPUs skaliert werden können, einem einzelnen Rack, das mit NVIDIA NVLink der fünften Generation und NVLink 5 Switch auf bis zu 72 Blackwell-GPUs skaliert werden kann, oder nur einem Achtel einer GPU.
Diese umfassende Plattform hilft Teams bei der Optimierung jedes Workloads, von Mixture-of-Experts-Reasoning, multimodaler Inferenz und Datenverarbeitung bis hin zu komplexen Simulationen für die nächste Dimension von physischer KI und Robotik.
Führende KI-Forschungslabore setzen diese Infrastruktur bereits ein. Thinking Machines Lab skaliert seine Anwendungsprogrammierschnittstelle (API) Tinker auf A4X Max VMs mit GB300 NVL72-Systemen, um das Training zu beschleunigen, während OpenAI umfangreiche Inferenz auf NVIDIA GB300 (A4X Max VMs) und GB200 NVL72 Systemen (A4X VMs) auf Google Cloud für einige seiner anspruchsvollsten Inferenz-Workloads, einschließlich ChatGPT, ausführt.
Sichere KI, wo auch immer sie ausgeführt wird, muss souverän und vertraulich sein
Google Gemini-Modelle, die auf NVIDIA Blackwell und Blackwell Ultra-GPUs ausgeführt werden, befinden sich jetzt in der Vorschau auf Google Distributed Cloud, sodass Kunden die Frontier-Modelle von Google dorthin bringen können, wo sich ihre sensiblen Daten befinden.
NVIDIA Confidential Computing mit der NVIDIA Blackwell-Plattform ermöglicht die Ausführung von Gemini-Modellen in einer geschützten Umgebung, in der Prompts und Feinabstimmungsdaten verschlüsselt bleiben und von Unbefugten, einschließlich der Infrastrukturbetreiber, nicht eingesehen oder geändert werden können.
In der öffentlichen Cloud bringt die Vorschau von Confidential G4 VMs mit NVIDIA RTX PRO 6000 Blackwell-GPUs diese Schutzmaßnahmen in Multi-Tenant-Umgebungen – sie tragen dazu bei, Prompts, KI-Modelle und Daten zu schützen, sodass Kunden in regulierten Branchen ohne Kompromisse bei Sicherheit oder Leistung auf die Leistungsfähigkeit der KI zugreifen können.
Dies ist das erste Confidential Computing-Angebot von NVIDIA Blackwell-GPUs in der Cloud, das Google Cloud-Kunden eine neue Grundlage für sichere, leistungsstarke KI bietet.
Offene Modelle und APIs für agentische KI
Die NVIDIA-Plattform auf Google Cloud ist für die Ausführung aller Arten von Modellen optimiert – von den Frontier-Familien Gemini und Gemma von Google bis hin zu offenen NVIDIA Nemotron-Modellen und dem breiteren Open-Weight-Ökosystem – und bietet Entwicklern die Möglichkeit, agentische KI-Systeme zu entwickeln, die logisch denken, planen und handeln.
NVIDIA Nemotron 3 Super ist auf der Gemini Enterprise Agent Platform verfügbar und bietet Entwicklern einen direkten Weg zur Ermittlung, Anpassung und Bereitstellung von NVIDIA-optimierten Reasoning- und multimodalen Modellen für agentische Workflows.
Google Cloud und NVIDIA erleichtern außerdem das Trainieren und Anpassen offener Modelle in großem Maßstab. Managed Training Clusters auf der Gemini Enterprise Agent Platform haben eine neue API für verwaltetes bestärkendes Lernen (RL) eingeführt, das mit NVIDIA NeMo RL entwickelt wurde, um RL-Training in großem Maßstab zu beschleunigen und gleichzeitig die Cluster-Größenbestimmung, Fehlerbehebung und Auftragsausführung zu automatisieren, sodass sich Teams auf das Agentenverhalten und die Modellqualität statt auf die Infrastrukturverwaltung konzentrieren können.
Der führende Anbieter von Cybersicherheit, CrowdStrike, nutzt offene NVIDIA NeMo-Bibliotheken wie NeMo Data Designer, NeMo Automodel und NeMo Megatron Bridge, um synthetische Daten zu generieren und Nemotron und andere offene große Sprachmodelle für fachspezifische Cybersicherheit zu optimieren. Diese Funktionen werden auf Managed Training Clustern auf der Gemini Enterprise Agent Platform mit NVIDIA Blackwell-GPUs ausgeführt und beschleunigen die Erkennung, Untersuchung und Reaktion auf Bedrohungen.
Die Zukunft der industriellen und physischen KI gestalten
Die Entwicklung industrieller und physischer KI in großem Maßstab erfordert leistungsstarke Hardware und eine Kombination aus offenen Modellen, Bibliotheken und Frameworks für die Entwicklung dieser komplexen End-to-End-Workflows.
Die NVIDIA KI-Infrastruktur, offene Modelle und physische KI-Bibliotheken, die auf Google Cloud verfügbar sind, integrieren industrielle und physische KI-Anwendungen, sodass Kunden reale Workflows simulieren, optimieren und automatisieren können.
Lösungen von führenden Anbietern von Industriesoftware wie Cadence und Siemens Digital Industries Software sind jetzt auf Google Cloud verfügbar und werden auf der NVIDIA KI-Infrastruktur beschleunigt. Diese Anwendungen unterstützen das Design, die Entwicklung und die Fertigung der nächsten Generation von Chips über autonome Fahrzeuge, Robotik, Luft- und Raumfahrtplattformen bis hin zu Schwermaschinen und groß angelegten Produktionssystemen.
Mit NVIDIA Omniverse-Bibliotheken und dem Open-Source-Framework für Robotik-Simulationen NVIDIA Isaac Sim, die auf Google Cloud Marketplace verfügbar sind, können Entwickler physikalisch genaue digitale Zwillinge erstellen und benutzerdefinierte Robotik-Simulationspipelines entwickeln, um Roboter vor der realen Bereitstellung zu trainieren, zu simulieren und zu validieren.
NVIDIA NIM-Microservices für Modelle wie NVIDIA Cosmos Reason 2 können für Google Vertex AI und Google Kubernetes Engine bereitgestellt werden. Dadurch können Roboter und Vision-KI-Agenten in der physischen Welt wie Menschen sehen, logisch denken und handeln, was Anwendungsfälle wie automatisierte Datenkuration und -annotation, fortschrittliche Roboterplanung und logisches Denken sowie intelligente Videoanalyse-Agenten für Echtzeit-Erkenntnisse und Entscheidungsfindung ermöglicht.
Gemeinsam ermöglichen diese Technologien Entwicklern einen nahtlosen Übergang vom computergestützten Design zu funktionierenden industriellen digitalen Zwillingen und KI-gesteuerten Robotern und beschleunigen so die Prozesse von der Entwurfsfreigabe bis zur Fabrikoptimierung auf der NVIDIA-Plattform, die auf Google Cloud läuft.
Nachgewiesene Wirkung: Von Startups bis hin zu globalen Unternehmen
Globale Unternehmen, KI-Labore und wachstumsstarke Startups nutzen die gemeinsam entwickelte Plattform von NVIDIA und Google Cloud, um schneller vom Prototyping in die Produktion zu gelangen, einschließlich Snap, Schrödinger und Salesforce. Snap senkt die Kosten für umfangreiche A/B-Tests, indem es Datenpipelines auf GPU-beschleunigtes Spark auf Google Cloud umstellt. Schrödinger reduziert wochenlange Simulationen zur Medikamentenentwicklung mit NVIDIA-beschleunigtem Computing auf Google Cloud auf nur wenige Stunden.
Startups orchestrieren die nächste Welle der KI-Innovationen – sie entwickeln neue Agenten und KI-native Anwendungen mit NVIDIA-beschleunigtem Computing auf der Google Cloud.
Als Teil eines umfassenderen Ökosystems, das durch NVIDIA Inception und Google for Startups hervorgehoben wird, nutzen CodeRabbit und Factory NVIDIA Nemotron-basierte Modelle auf Google Cloud, um Code-Überprüfungen und autonome Softwareentwicklungsagenten zu unterstützen, während Aible, Mantis AI, Photoroom und Baseten Unternehmensdaten, Videointelligenz, generative Bilder und verwaltete Inferenzlösungen auf der NVIDIA Full-Stack-Plattform auf Google Cloud erstellen.
Mehr als 90.000 Entwickler sind in etwas mehr als einem Jahr Teil der gemeinsamen NVIDIA und Google Cloud-Entwickler-Community geworden und nutzen diese Plattform, um neue KI-Anwendungen zu entwickeln und zu skalieren.
Darüber hinaus wurde NVIDIA auf der Next als Google Cloud Partner des Jahres in zwei Kategorien – AI Global Technology Partner und Infra Modernization Compute – in Anerkennung seines tiefgreifenden technischen Know-hows und seines Go-to-Market-Abgleichs ausgezeichnet.
Gemeinsam bieten NVIDIA und Google Cloud Kunden eine Cloud-Scale-Plattform, um experimentelle Agenten und Simulationen in Produktionssysteme zu verwandeln, die Code überprüfen, Flotten sichern, neue KI-Anwendungen ermöglichen und Fabriken in der realen Welt optimieren.
Erfahren Sie mehr über die Zusammenarbeit der Unternehmen, indem Sie an NVIDIA-Sitzungen, Demos und Workshops auf der Google Cloud Next teilnehmen.
