CEO AWS Matt Garman mengatakan Nova 2 Omni dirancang untuk mendukung berbagai jenis input sekaligus—teks, gambar, video, hingga suara—dan mampu menghasilkan keluaran berupa teks maupun gambar. Dengan pendekatan ini, AWS berupaya mengurangi kompleksitas penggunaan banyak model terpisah yang selama ini diperlukan untuk menangani beragam kebutuhan.
Nova 2 Omni memiliki kemampuan konteks yang luas dengan dukungan hingga 1 juta token, memungkinkan pemrosesan dokumen atau data dalam jumlah besar. Model ini juga mendukung lebih dari 200 bahasa untuk teks dan 10 bahasa untuk input suara. Pengguna dapat membuat atau mengubah gambar dengan perintah bahasa alami, termasuk konsistensi karakter, penambahan teks, serta modifikasi latar.
Selain itu, Nova 2 Omni menghadirkan pemahaman suara canggih yang mampu melakukan transkripsi, terjemahan, dan ringkasan percakapan multi-pembicara. AWS juga menyediakan kontrol fleksibel sehingga pengembang dapat menyesuaikan kedalaman reasoning dan anggaran komputasi untuk keseimbangan performa dan biaya.
Dengan kemampuan multimodal, Nova 2 Omni membuka peluang luas bagi berbagai sektor, mulai dari pembuatan konten pemasaran, transkripsi panggilan layanan pelanggan, analisis video, hingga dokumentasi dengan dukungan visual. Perusahaan dapat mempercepat pengembangan aplikasi sekaligus menekan biaya operasional.
Saat ini, Nova 2 Omni tersedia dalam tahap preview dengan akses awal bagi pelanggan Nova Forge. AWS mendorong perusahaan yang tertarik untuk menghubungi tim akun mereka guna mendapatkan akses lebih lanjut.
Peluncuran ini menegaskan ambisi Amazon dalam menghadirkan solusi AI yang lebih terintegrasi, efisien, dan siap menjawab kebutuhan global di era transformasi digital.
Cek Berita dan Artikel yang lain di
Google News