Agentenbasierte KI-Inferenz zu einem Zehntel der Kosten pro Token mit NVIDIA Vera Rubin NVL72. Agenten-Sandboxes laufen auf NVIDIA Vera 50 % schneller als auf herkömmlichen CPUs – während Unternehmensdatenabfragen mit der Vera-CPU bis zu 3-mal schneller sind. Und 5.000 Unternehmen wie Lilly, Samsung und Honeywell führen KI-Workloads in Dell AI Factories mit NVIDIA aus und überführen Ambitionen in die Produktion in großem Maßstab.
Dieses Bild zeichnete Michael Dell am Montagmorgen auf der Dell Technologies World. Dell hat die Tragweite beziffert: Die weltweiten KI-Infrastrukturausgaben könnten bis 2030 3-4 Billionen US-Dollar erreichen, wobei der Token-Verbrauch im selben Zeitraum voraussichtlich um 3.400 % wachsen wird.
„Es gibt bereits einen massiven Boom bei KI-Investitionen, und ein Produktivitätsboom setzt gerade ein – und das in einigen Unternehmen, einschließlich unserem“, sagte Dell. „Das Tempo des Wandels hat parabolische Ausmaße angenommen und zeigt keine Anzeichen für eine Verlangsamung.“
Anschließend begrüßte der Vorsitzende und CEO von Dell den NVIDIA-Gründer und CEO Jensen Huang auf der Keynote-Bühne – mit einem Blick auf das NVIDIA-Portfolio hinter ihm, von einer Deskside-Workstation Dell Pro Max mit GB10 bis hin zu einem Dell PowerRack mit NVIDIA Vera Rubin NVL72.
„Wir sind jetzt im Zeitalter der nutzbaren KI angekommen, was der Grund dafür ist, warum die Nachfrage parabolisch, absolut parabolisch steigt“, sagte Huang. „Was früher Monate dauerte, dauert jetzt Wochen. Was Wochen brauchte, dauert jetzt Tage. Und was sonst Tage dauert, dauert jetzt nur noch Stunden. Es ist eine große Sache für die Produktivität, aber ein gigantischer Sprung bei den Berechnungsanforderungen.“
Die Botschaft: Enterprise-KI hat die Pilotphase hinter sich gelassen und ist nun bei agentischer KI und Inferenz-Bereitstellungen in großem Maßstab angelangt. Die Plattform für das, was als Nächstes kommt, ist die Dell AI Factory mit NVIDIA – auf der Frontier-Modelle und autonome Agenten sicher hinter den Unternehmensgrenzen ausgeführt werden.
Eine neue KI-Fabrik für das Zeitalter der KI-Agenten
Die Nachrichten zum beschleunigten Computing stehen im Mittelpunkt der Aktualisierung: Der auf NVIDIA Vera Rubin NVL72 basierende Dell PowerEdge XE9812 bietet bei der agentischen KI-Inferenz im großen Maßstab bis zu 10-mal niedrigere Kosten pro Token als NVIDIA Blackwell.
Hinzu kommen die Server PowerEdge XE9880L, XE9885L und XE9882L – die ersten Dell-Systeme, die auf NVIDIA HGX Rubin NVL8 basieren und bis zu 144 GPUs pro Rack mit 100 % direkt flüssigkeitsgekühlten Rechenknoten und der bis zu 10-fachen Leistung von HGX B200 unterstützen.
Darüber hinaus wird das Netzwerkportfolio um das neue Dell PowerSwitch mit NVIDIA Quantum-X800 InfiniBand erweitert, das über flüssigkeitsgekühlte integrierte Optikmodule und NVIDIA Spectrum-6 Ethernet verfügt.
Dell stellt außerdem Dell PowerRack vor, ein voll integriertes System – Rechenleistung, Netzwerk und Speicher als eine Einheit – dessen Kühlung, Energiemanagement und Softwareoptimierung von Grund auf für ein Zusammenspiel konzipiert sind. Das Ergebnis sind beschleunigte KI- und High-Performance-Computing-Workloads im Unternehmensmaßstab, ohne den Integrationsaufwand einer Komponentenmontage.
Auf der CPU-Seite bringen die Dell PowerEdge M9822- und R9822-Server NVIDIA Vera CPUs in die KI-Fabrik des Unternehmens. Vera wurde speziell für agentische KI entwickelt und führt Datenpipelines, Analysen, Sandbox-Tools und Code-Workloads aus, bei denen jeder Schritt auf den vorherigen wartet.
Mit 1,2 TB/s Speicherbandbreite und einer vorhersehbaren Leistung unter Last bewältigt Vera agentische Workloads 50 % schneller als x86-Prozessoren, wodurch PowerEdge-Systeme die KI-Fabrikleistung mit schnelleren Agentenreaktionen und kürzeren Feedbackschleifen steigern können.
„Die Vera-CPU verfügt über die höchste Single-Thread-Leistung aller CPUs weltweit“, sagte Huang. „Sie verfügt über die dreifache Speicherbandbreite – daher laufen Starburst, DuckDB und all diese Datenbanken unglaublich schnell, da die Agenten die Datenbanken stark beanspruchen und die CPU besser superschnell sein sollte.“
Starburst, eine neue Datenengine auf der Dell AI Data Platform mit NVIDIA, bietet auf der NVIDIA Vera CPU einen dreifach schnelleren Abfragedurchsatz für groß angelegte SQL-Analysen.
Unternehmensdaten liefern den Treibstoff für die KI-Fabrik. Dells Aktualisierung seiner AI Data Platform mit NVIDIA konzentriert sich auf beschleunigte Daten-Engines, die auf NVIDIA CUDA-X-Bibliotheken basieren – darunter cuDF für strukturierte Daten und cuVS für unstrukturierte Daten.
Mehrere Kunden der Dell AI Factory mit NVIDIA wurden in der Keynote vorgestellt.
Diogo Rau, Executive Vice President und Chief Information and Digital Officer bei Lilly, stieß zu Beginn der Keynote hinzu und sprach über Lillys KI-getriebene Fortschritte und Innovationen in den Biowissenschaften, die durch eine mit Dell und NVIDIA in großem Maßstab eingesetzte KI-Infrastruktur ermöglicht werden.
Er beschrieb Technologie als Schlüssel zur Bereitstellung modernster Wissenschaft in großem Maßstab. „Ich denke, wir stehen kurz davor, Krankheiten, wie wir sie kennen, vielleicht ein Ende zu setzen“, sagte Rau. „So etwas war vor 20 Jahren völlig unvorstellbar, aber heute können wir es uns vorstellen.“
Es folgte ein Video von Samsung, in dem Anwendungsfälle für das Chip-Design und die Fertigung im Bereich Forschung und Entwicklung hervorgehoben wurden, die auf der Dell AI Factory mit NVIDIA ausgeführt werden.
Suresh Venkatarayalu, Chief Technology Officer bei Honeywell, begleitete Michael Dell bei der Erläuterung des Übergangs des Unternehmens von der öffentlichen Cloud zu On-Premises-KI – unter Verwendung der Dell AI Factory und der Dell AI Data Platform mit NVIDIA für industrielle KI-Anwendungsfälle, digitale Zwillinge und Automatisierung vom Rechenzentrum bis zum Edge.
„Für mich geht es bei der Partnerschaft mit Dell und NVIDIA nicht nur darum, Infrastruktur zu erhalten“, sagte Venkatarayalu. Es gehe um den gesamten KI-Stack, erklärte er: skalierbar, sicher und von Kunden geschätzt.
Und im Finanzdienstleistungssektor erweitert Hudson River Trading, das auf algorithmischen Handel spezialisierte Unternehmen, seine Dell-Bereitstellung, um KI-basierte Forschung voranzutreiben – unter Einsatz von Dell PowerEdge XE9685L-Servern mit beschleunigtem Computing von NVIDIA sowie NVIDIA Spectrum-X Ethernet, um mit den Daten, Modellen und Ambitionen des Unternehmens Schritt zu halten.
Agenten und Modelle vor Ort – sicher
Dells eigene Umfrage zur KI-Einführung, die in der Keynote erwähnt wurde, ergab, dass 67 % der KI-Workloads nun außerhalb der Cloud ausgeführt werden – vor Ort, auf Endgeräten, am Edge oder in Colocation-Umgebungen – und dass 88 % der Befragten mindestens eine KI-Workload vor Ort ausführen.
Die Ankündigungen zur On-Premises-KI beantworteten eine Frage, die Dell direkt an die Zuhörer richtete: „Wie stellen Sie die weltweit besten KI-Modelle dort bereit, wo Sie sie benötigen, und zwar mit integrierter Sicherheit und Governance?“
Die Antwort liegt in NVIDIA Confidential Computing – bereitgestellt zusammen mit Fortanix, Google, Red Hat und anderen Partnern – als Grundlage für die sichere Bereitstellung von Spitzenmodellen innerhalb des Unternehmens, ohne Modell-IP oder Daten offenzulegen.
Auf diese Weise können Unternehmen KI-Modelle und sensible Daten während der Nutzung schützen und gleichzeitig von der Token-Effizienz, Leistung und den Kostenvorteilen einer lokalen KI-Infrastruktur profitieren.
Proprietäre Spitzenmodelle, geschützt durch Confidential Computing
Google Distributed Cloud (GDC) mit Gemini 3.0 ist jetzt als Vorschauversion auf Dell PowerEdge XE9780-Servern verfügbar, beschleunigt durch NVIDIA Blackwell und gesichert durch NVIDIA Confidential Computing – und bietet Unternehmen eine private, vertrauliche Rechenumgebung für fortschrittliche KI.
SpaceXAI wird zudem die neuesten SpaceXAI-Modelle lokal in der Dell AI Factory einsetzen, wobei NVIDIA Confidential Computing die Modellgewichte und Unternehmensdaten durchgängig schützt.
Offene Frontier-Modelle, die nativ auf der Dell AI Factory ausgeführt werden
NVIDIA Nemotron-Modelle – offene Intelligenz der Spitzenklasse – laufen auf der Infrastruktur der Dell AI Factory für Unternehmen, die sich Open-Weight-Modelle wünschen, die auf ihre eigenen Fachbereiche und Daten abgestimmt sind.
Die Open-Source-Frontier-KI-Modelle von Reflection werden ebenfalls vor Ort verfügbar sein und sind speziell für regulierte Branchen, Regierungen und staatliche Stellen konzipiert.
Weitere offene Modelle – MiniMax-M2.7, DeepSeek Pro, DeepSeek-V4, GLM 5.1 und Kimi K2.6 mit NVIDIA NVFP4-Optimierung – sind im Dell Enterprise Hub auf Hugging Face verfügbar und ergänzen Gemma 4, NVIDIA Nemotron Super 3, Mistral Small 4 und Arcee Trinity-Large-Thinking.
In dieser neuen Ära der Agenten benötigen Unternehmen auch Agenten, die sicher in den hybriden und lokalen Umgebungen arbeiten, in denen sich ihre Daten, Systeme und Workflows bereits befinden.
OpenAI Codex wird mit der Dell AI Data Platform verbunden, um Kunden zu helfen, Codex näher an den internen Kontext heranzuführen, der Agenten nützlich macht: Codebasen, Dokumentation, Geschäftssysteme, betriebliches Wissen und Team-Workflows. Dell und OpenAI werden auch untersuchen, wie Codex mit der Dell AI Factory verbunden werden kann.
Ökosystem von Softwarepartnern
Dell kündigte mehrere neue Softwarepartnerschaften für gängige KI-Anwendungsfälle in Unternehmen an, die von agentischer KI und Code-Assistenten bis hin zu Computer Vision reichen.
Dazu gehört Palantirs Referenzarchitektur für das souveräne KI-Betriebssystem mit NVIDIA, die im März angekündigt wurde und nun auf der Dell-Infrastruktur läuft – für die lokale Bereitstellung von Palantir Ontology und AIP, integriert in die Referenzarchitektur für das souveräne KI-Betriebssystem von NVIDIA.
Darüber hinaus können ServiceNow-Kunden die Dell AI Factory nutzen, um Infrastruktur und die Automatisierung von Unternehmens-Workflows zusammenzuführen, wodurch Unternehmen in die Lage versetzt werden, KI mit dem Schwerpunkt auf Geschäftsergebnisse zu entdecken, zu steuern und zu operationalisieren.
Dell kündigte zudem neue Lösungen mit einer Vielzahl von führenden KI-Unternehmen und Software-Innovatoren an, darunter Fogsphere, Ipsotek, Mistral AI, Poolside und Uneeq, sowie Sicherheitspartnerschaften mit CrowdStrike und Fortanix.
Agenten vom Schreibtisch bis zum Rechenzentrum
Die persönlichste Neuigkeit: Dell Deskside Agentic AI mit dem NVIDIA NemoClaw-Stack, der NVIDIA OpenShell-Laufzeitumgebung und den offenen NVIDIA Nemotron-Modellen läuft auf Dell Pro Max mit GB10 und GB300, die auf der NVIDIA Grace Blackwell-Architektur basieren, sowie auf Dell Pro Precision-Systemen, die auf NVIDIA RTX PRO Blackwell Workstation-Plattformen basieren.
Die Anpassungsschicht: NVIDIA Nemotron, NVIDIA Agent Toolkit und NVIDIA NeMoClaw – die Agenten-Orchestrierungs-Struktur, die Huang auf der Bühne als Verbindungsschicht zwischen lokalen Modellen und Unternehmensdaten beschrieb – bilden die Grundlage für die Entwicklung autonomer Unternehmensagenten und ermöglichen es Unternehmen, Modelle anzupassen, Agenten-Workflows zu orchestrieren und Agenten sicher mit Unternehmensdaten und Tools zu verbinden.
Die Sicherheitsebene: NVIDIA OpenShell, eine Open-Source-Laufzeitumgebung für die Entwicklung und Bereitstellung autonomer Agenten mit Sicherheits- und Datenschutzkontrollen, ermöglicht die Durchsetzung von Unternehmensrichtlinien auf der Infrastrukturebene und ist in führende Unternehmenssoftwareplattformen integriert.
NVIDIA OpenShell wird nun in der gesamten Dell AI Factory mit NVIDIA unterstützt und bietet Entwicklern eine sichere Laufzeitumgebung für die Erstellung, Bereitstellung und Verwaltung von KI-Agenten, von Workstations bis hin zu Servern.
Dell hob außerdem die Unterstützung für den NVIDIA AI-Q Blueprint hervor, der Unternehmen ein Referenzbeispiel für die Bereitstellung von Multi-Agenten-Workflows für die intensive Forschung bietet und so den Weg von der Entwicklung über das Pilotprojekt bis hin zur Produktion beschleunigt.
Tag Zwei
Am zweiten Tag der Dell Technologies World werden Jeff Clarke, Chief Operations Officer von Dell, und Arthur Lewis, Präsident der Infrastructure Solutions Group, tiefer auf NVIDIA Vera CPU, Vera Rubin, Confidential Computing und Nemotron eingehen – mit einer Live-Demo der Dell Deskside Agentic AI.
Die Themen, die Huang und Dell am Montag vorgestellt haben – sichere, langlebige Agenten, Full-Stack-Fabriken, sichere Bereitstellung vor Ort – bilden den Rahmen für die weiteren Ankündigungen, die NVIDIA auf der GTC Taipeh im Rahmen der COMPUTEX vom 1. bis 4. Juni präsentieren wird.
