NVIDIA bekräftigt sein starkes Engagement für Open Source und stellt neue quelloffene KI-Technologien für Sprache, Robotik und Biologie vor. Diese tragen zu einem offenen Ökosystem bei, das den Zugang zur KI erweitert und für mehr Innovation in den USA sorgt.
Dank dieser offenen Technologien bieten sich Entwicklern weltweit neue Möglichkeiten. Dies führt aufgrund effizienter Schlussfolgerungen, hochpräziser Weltgenerierung und durch NVIDIA-Infrastruktur beschleunigter interaktiver physischer KI-Systeme zu vermehrtem Wirtschaftswachstum.
Die neuen offenen Modelle, Daten und Tools sind Teil der NVIDIA Nemotron-Familie für KI-Reasoning und der NVIDIA Cosmos-Plattform für physische KI sowie von NVIDIA Isaac GR00T für Robotik und NVIDIA Clara für biomedizinische KI.
NVIDIA stellt diese Modelle, Daten und Trainingsframeworks auf Hugging Face bereit, um den Zugang zu KI-Forschung und -Entwicklung zu erleichtern. Als einer der größten Beitragenden zu Hugging Face, wo aktuell über 650 offene Modelle und 250 offene Datensätze verfügbar sind, baut NVIDIA den Zugang zu modernsten KI-Ressourcen für die globale Entwickler-Community weiter aus.
„Offene Modelle sind Katalysatoren für KI-Innovationen und machen KI zugänglich, transparent und verantwortungsvoll“, erklärte Clément Delangue, CEO von Hugging Face. „Die Beiträge von NVIDIA zum Ökosystem offener Modelle, das Engagement des Unternehmens für offene KI-Forschung und das Ökosystem von Hugging Face werden Millionen von Entwicklern in die Lage versetzen, fortschrittliche KI zu entwickeln – gemeinsam und offen.“
NVIDIA Nemotron ermöglicht ultra-effizientes Reasoning für spezialisierte KI-Agenten
KI-Agenten nutzen mehrere Modelle, um zu sehen, abzurufen, zu generieren und Schlussfolgerungen zu ziehen. In den aktuellsten offenen Modellen der NVIDIA Nemotron-Familie werden diese Funktionen zusammengeführt, was Entwicklern das Erstellen spezialisierter, intelligenter Agenten ermöglicht.
- Nemotron Nano 3 nutzt eine hybride MoE-Architektur, um den Reasoning-Durchsatz in Bereichen wie der Softwareentwicklung, dem Kundenservice und dem IT-Support zu verbessern.
- Nemotron Nano 2 VL zeichnet sich durch Dokumentenintelligenz, Bildverständnis und Videoanalyse aus.
- Nemotron Parse extrahiert Text und Tabellen aus Dokumenten, um umsetzbare Erkenntnisse zu gewinnen.
- Nemotron Safety Guard fügt kultursensible mehrsprachige Moderationsfunktionen hinzu, die schädliche Inhalte aus 23 Sicherheitskategorien in neun Sprachen erkennen.
- Nemotron Retrieval-Augmented Generation (RAG)-Modelle ermöglichen jetzt eine erweiterte Dokumentenextraktion und einheitliche Abrufe aus Text-, Bild-, Audio- und Videodatenquellen.
NVIDIA veröffentlichte außerdem neue Open-Source-Nemotron-Datensätze – mit multimodalem Training, mehrsprachigen Personas und den Datenschutz wahrenden synthetischen personenbezogenen Daten – für die Entwicklung spezialisierter Modelle. Darüber hinaus bieten neue NVIDIA NeMo-Tools Entwicklern mehr Kontrolle über die Modellanpassung, darunter NeMo Data Designer für die Erzeugung synthetischer Daten und NeMo-RL für fortgeschrittenes Post-Training und bestärkendes Lernen.
Führende Softwareunternehmen entwickeln agentenbasierte KI auf Nemotron-Basis
Open-Source-Modelle ermöglichen Entwicklern das Erstellen und Anpassen der KI für ihre Domänen und die Transformation der Software in agentenbasierte Systeme, die Tools nutzen und nicht nur bereitstellen. Führende Software- und Dienstleistungsunternehmen entwickeln mit NVIDIA Nemotron agentenbasierte Softwareplattformen.
ServiceNow hat auf Basis des Erfolgs der Apriel Nemotron-Modellfamilie, deren Post-Training mit von NVIDIA und von ServiceNow bereitgestellten Daten erfolgte, sein neues Apriel 2.0-Multimodal-Reasoning-Modell vorgestellt. Mithilfe dieses Modells werden unternehmensübergreifende Workflows aller Branchen intelligenter, einschließlich regulierter Sektoren wie Finanzdienstleistungen, Gesundheitswesen und Telekom.
„Offene Modelle treiben die nächste Welle der Unternehmenstransformation voran“, erklärte Joe Davis, Executive Vice President für Platform Engineering and AI bei ServiceNow. „Apriel 2.0 ist eines der ersten multimodalen Open-Weight-Reasoning-Modelle, das für Unternehmen entwickelt wurde und Text-, Dokument- und Datenverständnis kombiniert, um branchenübergreifende Workflows aus der realen Welt zu unterstützen. Zusammen mit NVIDIA verbinden wir Reasoning-Transparenz mit Leistungseffizienz und bringen erklärbare, sichere und skalierbare KI in Branchen, in denen es vor allem auf Vertrauen und Compliance ankommt.“
Weitere führende Softwareunternehmen führen die neuesten Reasoning-Modelle von NVIDIA ein, um ihre KI-Anwendungen der nächsten Generation zu unterstützen:
- Palantir stellt Nemotron über seine Ontologie in Foundry und AIP bereit, um mit NVIDIA einen integrierten Technologie-Stack für operative KI zu unterstützen.
- Cadence beschleunigt die Produktivität der Chipdesigner mit seiner JedAI-Plattform und offenen Nemotron-Technologien.
- CrowdStrike integriert mit NVIDIA Nemotron autonome, kontinuierlich lernende KI-Agenten in seine Agentic Security-Plattform.
- PayPal steigert mit Nemotron den Durchsatz und die Kosteneffizienz seiner KI-Services um 50 %.
- Synopsys arbeitet gemeinsam mit NVIDIA an der Entwicklung von Chipdesign-Agenten mit dem NVIDIA NeMo Agent-Toolkit und offenen Nemotron-Modellen und -Daten, die von NVIDIA-Ingenieuren genutzt werden.
- Zoom nutzt Nemotron für maßgeschneiderte Agentenfunktionen für die spezifischen Workflows seiner Kunden.
Offene Cosmos- und Isaac GR00T-Modelle und -Daten für physische KI und Robotik
Um das Training von Robotersystemen mit menschlichem Schlussfolgern und Kognition zu beschleunigen, hat NVIDIA wichtige Updates seiner offenen Modelle für physische KI durchgeführt, darunter die Cosmos World Foundation-Modelle und Isaac GR00T-Roboter-Foundation-Modelle:
- Cosmos Predict 2.5: Vereint drei Modelle zu einem Modell für schnelle Weltsimulation und generiert 30-Sekunden-Videos aus einem einzigen Frame.
- Cosmos Transfer 2.5: Erzeugt qualitativ hochwertigere fotorealistische Daten aus 3D-Szenen, deren Größe rund ein Drittel der Größe von Cosmos Transfer 1 ausmacht.
- Cosmos Reason: Ein Reasoning-VLM (Vision Language Model), das jetzt für fortgeschrittene multimodale Verständnisfunktionen als NVIDIA NIM-Microservice verfügbar ist.
- Cosmos Dataset Search: Ermöglicht das sofortige Abrufen von Trainingsszenarien und verkürzt die monatelangen Post-Trainingszyklen auf einige Tage.
- Isaac GR00T N1.6: Verbessert das Schlussfolgern, die Generalisierung und die Gesamtkörperregelung für humanoide Roboter.
NVIDIA hat außerdem den weltweit größten Open-Source-Datensatz für physische KI veröffentlicht, der jetzt 1.700 Stunden multimodaler Fahrzeugsensordaten aus den USA und Europa sowie GR00T-Trainingsdaten umfasst und zu den Top 10 der am häufigsten heruntergeladenen Hugging Face-Datensätze aller Zeiten gehört.
Führende Unternehmen wie Agility Robotics, Amazon Robotics, Figure AI, Skild AI, Milestone Systems und Uber nutzen Cosmos- oder Isaac GR00T N-Modelle, um synthetische Daten zu generieren, Robotern neue Verhaltensweisen beizubringen und im großen Maßstab reale und physische KI-Agenten bereitzustellen.
Offene NVIDIA Clara-Modelle für Gesundheitswesen und Life Sciences
Neue offene Modelle ergänzen NVIDIA Clara, eine Familie aus Modellen, Tools und Rezepten, die für die Beschleunigung wissenschaftlicher Entdeckungen, die Analyse medizinischer Bilder und mehr entwickelt wurde:
- Clara CodonFM: Erlernt die Regeln der RNs, um offenzulegen, wie Änderungen am Code das Design von Therapien und Medikamenten verbessern können. NVIDIA wird offene Modelle wie CodonFM zur Plattform für virtuelle Zellen der Chan Zuckerberg Initiative (CZI) einbringen, um die Open-Source-Zusammenarbeit und -Modellauswertung zu beschleunigen.
- Clara La-Proteina: Erstellt 3D-Proteinstrukturen Atom für Atom mit der doppelten Länge und Komplexität bisheriger Modelle und erleichtert so die Entwicklung besserer Medikamente, Enzyme und Materialien.
- Clara Reason: Ein Vision-Language-Modell, das eine Schlussfolgerung aus einer Gedankenkette für die radiologische und medizinische Bildgebung ermöglicht und damit erklärbare medizinische KI-Forschung fördert.
Erste Schritte mit offenen NVIDIA-Modellen
Auf ausgewählte offene NVIDIA Nemotron- und Cosmos-Modelle, die in der NVIDIA DGX Cloud trainiert wurden, kann auf build.nvidia.com, Hugging Face, OpenRouter und Microsoft Azure AI Foundry zugegriffen werden. In Kürze werden sie auf der Google Vertex AI Platform und bei anderen Cloud-Service-Anbietern verfügbar sein. NVIDIA Clara und Isaac GR00T sind auf Hugging Face verfügbar.
Die Modelle sind als NVIDIA NIM-Microservices für die sichere, skalierbare Bereitstellung in der DGX Cloud oder einer beliebigen NVIDIA-beschleunigten Infrastruktur für maximale Privatsphäre und Kontrolle verfügbar.
Erfahren Sie mehr darüber, wie NVIDIA und Partner die KI-Innovationen in den USA vorantreiben, und sehen Sie sich die Keynote von Huang anlässlich der NVIDIA GTC in Washington D.C. an.
