NVIDIA Nemotron 3 Ultra ist verfügbar – mit den Early Adopters Perplexity, Palantir und ServiceNow, die langlaufende KI-Agenten antreiben

by

NVIDIA hat heute Nemotron 3 Ultra veröffentlicht, ein offenes Modell, das für langlaufende Agenten entwickelt wurde und Beiträge der Nemotron Coalition enthält.

Modelle, die langlaufende Agenten antreiben, tun mehr als nur Text zu generieren. Sie interpretieren Informationen, planen die nächsten Schritte, rufen Tools auf, bewerten Ergebnisse und iterieren über mehrere Durchläufe hinweg, um komplexe Aufgaben in den Bereichen Programmierung, Forschung und Unternehmensanwendungen zu erledigen. Dies erfordert effiziente Modelle, die in kürzerer Zeit mehr des Suchraums erkunden können, um schneller Ergebnisse mit höherer Genauigkeit zu liefern.

Nemotron 3 Ultra wurde genau für diesen neuen Workload entwickelt. Es handelt sich um ein intelligentes Frontier-Modell, das eine bis zu 5-mal schnellere Inferenz liefert und die Kosten für komplexe agentenbasierte Aufgaben um bis zu 30 % senkt. Dadurch können Agenten dieselbe Aufgabe in kürzerer Zeit abschließen oder in derselben Zeit mehr Aufgaben erledigen.

Nemotron 3 Ultra, ein Mixture-of-Experts-Modell mit 550 Milliarden Parametern, übernimmt die Orchestrierung und die schwierigsten Reasoning-Entscheidungen in einem autonomen Workflow: architektonische Entscheidungen in langlaufenden Programmiersitzungen, die Synthese über Hunderte von Quellen hinweg und die Überprüfung über Tausende voneinander abhängiger Einschränkungen.

Führende Anbieter von Unternehmenssoftware entwickeln Agenten mit dem neuen Modell, unter anderem für Workflows in den Bereichen Softwareentwicklung, Deep Research, Kundenservice und Unternehmensautomatisierung.

  • Aible integriert Nemotron3 Ultra in die AibleClaw-Plattform, wodurch seine Kunden sichere, langlaufende Agenten im großen Maßstab für verschiedene Domänen entwickeln können.
  • Glean stellt Nemotron 3 Ultra in seinem modellunabhängigen Agent-Harness bereit, neben einem mit Nemotron 3 Nano feinabgestimmten Agentic-Search-Modell, und erweitert so den Zugang von Unternehmen zu kosteneffizienter, agentenbasierter Enterprise-KI.
  • Greptile integriert Nemotron 3 Ultra in seine Code-Review-Plattform zur Indexierung von Codebasen und ermöglicht so Code-Reviews mit führender Genauigkeit zu geringeren Kosten.
  • Harvey ermöglicht über seine Plattform die Unterstützung von Nemotron 3 Ultra und nachtrainierten Versionen des Modells und hilft Kunden, KI-gestützte juristische Workflows mit größerer Kontrolle über ihre Daten zu entwickeln und einzusetzen.
  • Perplexity nutzt Nemotron 3 Ultra für die Suche und für Perplexity Computer und verwendet seinen Agent-Router, um Workloads je nach Aufgabe an feinabgestimmte offene Modelle oder proprietäre Modelle zu leiten, wodurch seine KI-Assistenten mit Geschwindigkeit, Effizienz und Skalierbarkeit arbeiten können.

Wie Anfang dieser Woche angekündigt, setzen CrowdStrike und Palantir Nemotron 3 Ultra ein, um eine neue Klasse langlaufender KI-Agenten zu ermöglichen, die Teams dabei helfen, komplexe Daten zu analysieren, Aufgaben zu koordinieren und Abläufe in Cybersicherheits- und Unternehmensumgebungen zu optimieren.

Zu den weiteren Unternehmen, die das Modell einsetzen, gehören Applied Compute, CodeRabbit, Dataiku und ServiceNow.

Das Modell wird auf Agenten-Traces trainiert und für Agent-Harnesses optimiert, sodass Entwickler ihre bevorzugten Frameworks wählen können, ohne Einbußen bei der Genauigkeit.

Agentenplattformen und -Harnesses wie BlackBox AI, Cline, Factory AI, Hermes Agent, Kilo Code, LangChain Deep Agents, OpenClaw, OpenCode, OpenHands und Pi unterstützen die neuen Nemotron-Modelle.

Nemotron 3 Ultra funktioniert mit dem NVIDIA NemoClaw-Blueprint, der Unternehmen eine sichere Laufzeitumgebung, offene Modelle und domänenspezifische Skillsbietet, um autonome Agenten im großen Maßstab einzusetzen.

H Company, Naver, Nous und Prime Intellect treten der Nemotron Coalition bei

H Company, NAVER Cloud, Nous Research und Prime Intellect treten der Nemotron Coalition bei. Diese Mitglieder bringen einzigartige Stärken in den Bereichen Daten, Trainingsumgebungen, Evaluierungs-Frameworks und Fachwissen ein, um die kollaborative Entwicklung eines offenen Frontier-Modells zu unterstützen, das auf NVIDIA DGX Cloud trainiert wird und als Grundlage für die kommende Nemotron 4-Familie dienen wird.

Durch die Bündelung ihrer Kräfte bringt die Koalition führende globale KI-Labore und Infrastrukturanbieter zusammen, um die Entwicklung offener Frontier-Modelle zu beschleunigen. Dieser kollaborative Ansatz zielt darauf ab, den Zugang zu modernster KI-Innovation zu erweitern und Entwicklern und Unternehmen weltweit zu ermöglichen, Modelle für ihre Branchen, Regionen und Anwendungsfälle zu entwickeln und anzupassen.

Neue Nemotron-Sprach- und Sicherheitsmodelle

Ebenfalls ab heute verfügbar: Ein neues Nemotron-Spracherkennungsmodell bringt Echtzeit-Streaming-ASR in 40 Sprachgebiete für Voice-Agent-Workflows in globalen Unternehmensbereitstellungen. Das Nemotron 3.5 Content Safety-Modell – ein offenes multimodales Modell mit 4 Milliarden Parametern – klassifiziert Inhalte über 23 Sicherheitskategorien und ein Dutzend Sprachen hinweg und unterstützt benutzerdefinierte Unternehmensrichtlinien.

Offen, anpassbar und überall einsetzbar

Nemotron-Modelle werden mit offenen Gewichten, Datensätzen und Rezepten veröffentlicht und geben Organisationen Transparenz und Kontrolle, um Modelle für domänenspezifische Workflows anzupassen und dort einzusetzen, wo ihre Anwendungen und Daten liegen.
Entwickler können Tools wie NVIDIA NeMo zur Anpassung, Evaluierung und Optimierung für ihre Anwendungsfälle verwenden. Da die Nemotron-Modellfamilie offen ist, können Organisationen sie in Umgebungen einsetzen, die regulatorische, souveränitäts-bezogene oder datenlokalisierungs-bezogene Anforderungen erfüllen.

Die Modelle sind auf Hugging Face, ModelScope, OpenRouter und build.nvidia.com als NVIDIA NIM-Microservices sowie über ein breites Ökosystem von NVIDIA Cloud Partners, Inferenzplattformen und Cloud-Service-Anbietern verfügbar.