Kehadiran teknologi ini ditujukan untuk mempercepat pengembangan AI agentic, yaitu agen pintar yang mampu menjalankan berbagai tugas kompleks mulai dari penggunaan komputer, analisis dokumen, hingga pemahaman audio-visual.
Model terbaru ini diklaim menghadirkan efisiensi hingga sembilan kali lipat dibandingkan model terbuka sejenis, sekaligus menempati posisi teratas dalam enam leaderboard yang menguji kecerdasan dokumen dan pemahaman audio-video. Dengan performa tinggi, Nemotron 3 Nano Omni memungkinkan perusahaan menekan biaya operasional tanpa mengorbankan akurasi.
Arsitektur yang digunakan adalah 30B-A3B hybrid mixture-of-experts (MoE), dilengkapi teknologi Conv3D, EVS, serta konteks hingga 256K. Model ini tersedia sejak 28 April 2026 melalui Hugging Face, OpenRouter, build.nvidia.com, dan mitra resmi lainnya.
Sejumlah perusahaan besar seperti Aible, ASI, Eka Care, Foxconn, H Company, Palantir, dan Pyler telah menjadi pengguna awal, sementara Dell, Docusign, Infosys, Oracle, dan Zefr tengah mengevaluasi penerapannya.
Dalam praktiknya, Nemotron 3 Nano Omni dapat digunakan untuk berbagai kebutuhan. Misalnya, membantu agen komputer menavigasi antarmuka grafis dan menafsirkan konten layar dengan resolusi tinggi, mendukung kecerdasan dokumen dengan memahami tabel dan grafik, serta menjaga konsistensi alur pemahaman dalam audio-video reasoning.
Dengan kapabilitas tersebut, model ini berperan sebagai mata dan telinga dalam sistem agentic, bekerja berdampingan dengan model lain seperti Nemotron 3 Super dan Ultra.
NVIDIA juga menekankan keterbukaan ekosistem dengan merilis open weights, dataset, dan teknik pelatihan sehingga pengembang dapat melakukan kustomisasi menggunakan NVIDIA NeMo.
Model ini mendukung penerapan di berbagai lingkungan, mulai dari lokal, pusat data, hingga cloud. Menariknya, keluarga Nemotron telah mencatat lebih dari 50 juta unduhan dalam setahun terakhir, menegaskan tingginya minat komunitas terhadap solusi AI terbuka.
Cek Berita dan Artikel yang lain di
Google News