Künstliche Intelligenz tritt in eine neue Ära ein – agentenbasierte KI –, in der Teams spezialisierter Agenten Menschen helfen können, komplexe Probleme zu lösen und sich wiederholende Aufgaben zu automatisieren.
Mit benutzerdefinierten KI-Agenten können Unternehmen in sämtlichen Branchen Intelligenz schaffen und eine beispiellose Produktivität erzielen. Diese fortschrittlichen KI-Agenten erfordern ein System aus mehreren generativen KI-Modellen, die für agentenbasierte KI-Funktionen und -Fähigkeiten optimiert sind. Diese Komplexität führt dazu, dass der Bedarf nach leistungsstarken, effizienten Modellen auf Unternehmensebene nie größer war.
NVIDIA hat heute die Llama Nemotron Familie offener großer Sprachmodelle (LLMs) als Grundlage für agentenbasierte KI in Unternehmen angekündigt. Die mit Llama entwickelten Modelle können Entwicklern dabei helfen, KI-Agenten für eine Reihe von Anwendungen zu entwickeln und bereitzustellen, darunter Kundensupport, Betrugserkennung und Optimierung der Produktlieferkette und des Bestandsmanagements.
Um effektiv zu sein, benötigen viele KI-Agenten sowohl Sprachkenntnisse als auch die Fähigkeit, die Welt wahrzunehmen und mit einer geeigneten Aktion zu reagieren.
Mit den neuen NVIDIA Cosmos Nemotron Vision-Sprachmodellen (VLMs) und NVIDIA NIM Microservices für die Suche und Zusammenfassung von Videos können Entwickler Agenten entwickeln, die Bilder und Videos von autonomen Maschinen, Krankenhäusern, Geschäften und Lagerhäusern sowie Sportveranstaltungen, Filmen und Nachrichten analysieren und darauf reagieren. Für Entwickler, die physikorientierte Videos für Robotik und autonome Fahrzeuge generieren möchten, hat NVIDIA heute separat die NVIDIA Cosmos World-Foundation-Modelle angekündigt.
Offene Llama Nemotron Modelle optimieren Recheneffizienz und Genauigkeit für KI-Agenten
NVIDIA Llama Nemotron Modelle wurden mit Llama Foundation-Modellen entwickelt – einer der beliebtesten kommerziell nutzbaren Open-Source-Modellsammlungen, die über 650 Mio. Mal heruntergeladen wurde – und bieten optimierte Bausteine für die Entwicklung von KI-Agenten. Dies baut auf NVIDIAs Engagement auf, hochmoderne Modelle wie Llama 3.1 Nemotron 70B zu entwickeln, die jetzt über den NVIDIA API-Katalog verfügbar sind.
Llama Nemotron Modelle werden mit den neuesten Techniken und hochwertigen Datenmengen von NVIDIA für verbesserte agentenbasierte Funktionen abgestimmt und trainiert. Sie eignen sich hervorragend für die Befolgung von Anweisungen, Chats, Funktionsaufrufe, Kodierungen und Berechnungen. Zudem ist ihre Größe optimiert, damit sie auf einer breiten Palette von durch NVIDIA Technik beschleunigten Computing-Ressourcen ausgeführt werden können.
„Agentenbasierte KI ist der nächste große Schritt in der KI-Entwicklung, und um in diesem Bereich erfolgreich zu sein, ist eine Full-Stack-Optimierung über ein System von LLMs zur Bereitstellung effizienter und genauer KI-Agenten erforderlich“, so Ahmad Al-Dahle, Vice President und Head of GenAI bei Meta. „Durch unsere Zusammenarbeit mit NVIDIA und unser gemeinsames Engagement für offene Modelle kann die NVIDIA Llama Nemotron Familie, die auf Llama basiert, Unternehmen dabei helfen, schnell ihre eigenen benutzerdefinierten KI-Agenten zu entwickeln.“
Führende Anbieter von KI-Agenten-Plattformen wie SAP und ServiceNow werden voraussichtlich zu den ersten gehören, die die neuen Llama Nemotron Modelle nutzen werden.
„KI-Agenten, die zusammenarbeiten, um komplexe Aufgaben in mehreren Geschäftsbereichen zu lösen, werden ein völlig neues Niveau der Produktivität in Unternehmen ermöglichen, das über die heutigen Szenarien mit generativer KI hinausgeht“, sagte Philipp Herzig, Chief AI Officer bei SAP. „Durch SAP Joule werden Hunderte von Millionen von Unternehmensanwendern mit diesen Agenten interagieren, um ihre Ziele schneller als je zuvor zu erreichen. Die neue offene Llama Nemotron Modellfamilie von NVIDIA wird die Entwicklung mehrerer spezialisierter KI-Agenten zur Transformation von Geschäftsprozessen fördern.
„KI-Agenten ermöglichen es Unternehmen, mit weniger Aufwand mehr zu erreichen und setzen neue Standards für die Transformation von Unternehmen“, sagte Jeremy Barnes, Vice President of Platform AI bei ServiceNow. „Die verbesserte Leistung und Genauigkeit der offenen Llama Nemotron Modelle von NVIDIA können dazu beitragen, fortschrittliche KI-Agenten-Services zu entwickeln, die komplexe Probleme in sämtlichen Anwendungsfällen und Branchen lösen.“
Die NVIDIA Llama Nemotron Modelle verwenden NVIDIA NeMo für die Destillation, das Zuschneiden und die Ausrichtung. Mit diesen Techniken sind die Modelle klein genug, um auf einer Vielzahl von Rechenplattformen ausgeführt werden zu können und gleichzeitig hohe Genauigkeit sowie einen erhöhten Modelldurchsatz bereitzustellen.
Die Llama Nemotron Modellfamilie wird als herunterladbare Modelle und als NVIDIA NIM Microservices verfügbar sein, die ganz einfach in Clouds, Rechenzentren, auf PCs und Workstations bereitgestellt werden können. Sie bieten Unternehmen branchenführende Leistung mit zuverlässiger, sicherer und nahtloser Integration in ihre agentenbasierten KI-Anwendungs-Workflows.
Anpassung und Verbindung zu Geschäftswissen mit NVIDIA NeMo
Die Llama Nemotron und Cosmos Nemotron Modellfamilien sind in den Größen Nano, Super und Ultra erhältlich, um sämtliche Bereitstellungsszenarien mit KI-Agenten abzudecken.
- Nano: Das kostengünstigste Modell ist für Echtzeitanwendungen mit geringer Latenz optimiert und eignet sich ideal für die Bereitstellung auf PCs und Edge-Geräten.
- Super: Ein hochpräzises Modell mit außergewöhnlichem Durchsatz auf einer einzigen GPU.
- Ultra: Das Modell mit der höchsten Genauigkeit wurde für Anwendungen im Rechenzentrum entwickelt, die höchste Leistung erfordern.
Unternehmen können die Modelle mit NVIDIA NeMo Microservices auch an ihre spezifischen Anwendungsfälle und Domänen anpassen, um die Datenkuratierung zu vereinfachen, die Anpassung und Evaluierung von Modellen zu beschleunigen und Guardrails anzuwenden, damit Antworten stets relevant sind.
Mit NVIDIA NeMo Retriever können Entwickler außerdem Retrieval-Augmented-Generation-Funktionen integrieren, um Modelle mit ihren Unternehmensdaten zu verbinden.
Zudem können Unternehmen mit NVIDIA Blueprints für agentenbasierte KI schnell ihre eigenen Anwendungen mit den fortschrittlichen KI-Tools und der End-to-End-Entwicklungskompetenz von NVIDIA entwickeln. NVIDIA Cosmos Nemotron, NVIDIA Llama Nemotron und NeMo Retriever optimieren sogar den neuen NVIDIA Blueprint für die Suche und Zusammenfassung von Videos, der heute separat angekündigt wurde.
NeMo, NeMo Retriever und NVIDIA Blueprints sind alle als Teil der NVIDIA AI Enterprise Softwareplattform verfügbar.
Verfügbarkeit
Llama Nemotron und Cosmos Nemotron Modelle werden in Kürze als gehostete Anwendungsprogrammierschnittstellen und zum Download auf build.nvidia.com und Hugging Face verfügbar sein. Der Zugang für Entwicklungs-, Test- und Forschungszwecken ist für Mitglieder des NVIDIA Entwicklerprogramms kostenlos.
Unternehmen können Llama Nemotron und Cosmos Nemotron NIM Microservices mit der NVIDIA AI Enterprise Softwareplattform im Produktionsbereich auf beschleunigter Rechenzentrums- und Cloud-Infrastruktur ausführen.
Siehe Hinweis zu Software-Produktinformationen.