Dengan agen AI kustom, perusahaan di seluruh industri dapat memproduksi kecerdasan dan mencapai produktivitas yang belum pernah terjadi sebelumnya. Agen AI canggih ini memerlukan sistem beberapa model AI generatif yang dioptimalkan untuk fungsi dan kemampuan AI agen. Kompleksitas ini berarti bahwa kebutuhan akan model tingkat perusahaan yang kuat, efisien, tidak pernah sebesar ini.
Untuk memberikan landasan bagi AI agen perusahaan, NVIDIA dalam ajang CES 2025 mengumumkan keluarga model bahasa besar terbuka (LLM) Llama Nemotron. Dibangun dengan Llama, model ini dapat membantu pengembang membuat dan menerapkan agen AI di berbagai aplikasi —- termasuk dukungan pelanggan, deteksi penipuan, dan rantai pasokan produk dan pengoptimalan manajemen inventaris.
Agar efektif, banyak agen AI membutuhkan keterampilan bahasa dan kemampuan untuk memahami dunia dan merespons dengan tindakan yang tepat.
Dengan model bahasa visi (VLM) Cosmos Nemotron baru dan layanan mikro NVIDIA NIM untuk pencarian dan peringkasan video, pengembang dapat membangun agen yang menganalisis dan merespons gambar dan video dari mesin otonom, rumah sakit, toko dan gudang, serta acara olahraga, film, dan berita. Untuk pengembang yang ingin menghasilkan video sadar fisika untuk robotika dan kendaraan otonom, NVIDIA secara terpisah mengumumkan model fondasi dunia NVIDIA.
Model Llama Nemotron Terbuka Mengoptimalkan Efisiensi Komputasi, Akurasi untuk Agen AI
Dibangun dengan model fondasi Llama — salah satu koleksi model open source yang paling populer secara komersial, diunduh lebih dari 650 juta kali — model Llama Nemotron menyediakan blok bangunan yang dioptimalkan untuk pengembangan agen AI.
Model Llama Nemotron dipangkas dan dilatih dengan teknik terbaru NVIDIA dan kumpulan data berkualitas tinggi untuk meningkatkan kemampuan agen. Mereka unggul dalam mengikuti instruksi, mengobrol, pemanggilan fungsi, pengkodean, dan matematika, sambil dioptimalkan ukuran untuk berjalan pada berbagai sumber daya komputasi yang dipercepat.
"Agentic AI adalah perbatasan berikutnya dari pengembangan AI, dan memberikan peluang ini membutuhkan pengoptimalan tumpukan penuh di seluruh sistem LLM untuk memberikan agen AI yang efisien dan akurat," kata Ahmad Al-Dahel, wakil presiden dan kepala GenAI di Meta.
"Melalui kolaborasi kami dengan NVIDIA dan komitmen bersama kami untuk model terbuka, keluarga NVIDIA Llama Nemotron yang dibangun di atas Llama dapat membantu perusahaan dengan cepat membuat agen AI kustom mereka sendiri."
Penyedia platform agen AI terkemuka termasuk SAP dan ServiceNow diharapkan menjadi yang pertama menggunakan model Llama Nemotron baru.
"Agen AI yang berkolaborasi untuk menyelesaikan tugas-tugas kompleks di berbagai lini bisnis akan membuka tingkat produktivitas perusahaan yang sama sekali baru di luar skenario AI generatif saat ini," kata Philipp Herzig, chief AI officer di SAP. "Melalui Joule SAP, ratusan juta pengguna perusahaan akan berinteraksi dengan agen-agen ini untuk mencapai tujuan mereka lebih cepat dari sebelumnya. Keluarga model Llama Nemotron terbuka baru NVIDIA akan mendorong pengembangan beberapa agen AI khusus untuk mengubah proses bisnis."
"Agen AI memungkinkan organisasi untuk mencapai lebih banyak dengan lebih sedikit usaha, menetapkan standar baru untuk transformasi bisnis," kata Jeremy Barnes, wakil presiden platform AI di ServiceNow. "Peningkatan kinerja dan akurasi model Llama Nemotron terbuka NVIDIA dapat membantu membangun layanan agen AI canggih yang memecahkan masalah kompleks di seluruh fungsi, di industri apa pun."
Model Llama Nemotron menggunakan NVIDIA NeMo untuk penyulingan, pemangkasan, dan penyelarasan. Dengan menggunakan teknik ini, model cukup kecil untuk berjalan pada berbagai platform komputasi sambil memberikan akurasi tinggi serta peningkatan throughput model.
Keluarga model Llama Nemotron akan tersedia sebagai model yang dapat diunduh dan sebagai layanan mikro NVIDIA NIM yang dapat dengan mudah digunakan di cloud, pusat data, PC, dan workstation. Mereka menawarkan kinerja terdepan di industri perusahaan dengan integrasi yang andal, aman, dan mulus ke dalam alur kerja aplikasi AI agen mereka.
Keluarga model Llama Nemotron dan Cosmos Nemotron hadir dalam ukuran Nano, Super, dan Ultra untuk memberikan opsi untuk menyebarkan agen AI di setiap skala.
Perusahaan juga dapat menyesuaikan model untuk kasus penggunaan dan domain spesifik mereka dengan layanan mikro NVIDIA NeMo untuk menyederhanakan kurasi data, mempercepat penyesuaian dan evaluasi model, dan menerapkan batasan untuk menjaga respons tetap pada jalurnya.
Dengan NVIDIA NeMo Retriever, pengembang juga dapat mengintegrasikan kemampuan retrieval-augmented generation (RAG) untuk menghubungkan model ke data perusahaan mereka.
Dan dengan menggunakan NVIDIA Blueprints untuk AI agen, perusahaan dapat dengan cepat membuat aplikasi mereka sendiri menggunakan alat AI canggih dan keahlian pengembangan end-to-end.
Perusahaan dapat menjalankan layanan mikro NIM Llama Nemotron dan Cosmos Nemotron dalam produksi dengan platform perangkat lunak NVIDIA AI Enterprise pada pusat data dan infrastruktur cloud yang dipercepat.
Cek Berita dan Artikel yang lain di
Google News