Solusi VMware Private AI Foundation with Nvidia ini memungkinkan perusahaan untuk memanfaatkan potensi AI generatif dengan mengadaptasi model dan menjalankan aplikasi seperti chatbot cerdas, asisten, pencarian, dan peringkasan.
Platform ini akan ditawarkan sebagai sebuah solusi terintegrasi yang menggabungkan perangkat lunak AI generatif dengan accelerated computing dari Nvidia, yang dibangun di atas dasar VMware Cloud Foundation dan dioptimalkan khusus untuk aplikasi AI.
"Kombinasi antara AI Generatif dan multi-cloud merupakan langkah yang sempurna,” jelas Raghu Raghuram, CEO VMware.
“Data pelanggan tersebar di berbagai tempat— di pusat data, edge, hingga cloud. Bersama Nvidia, kami memberdayakan perusahaan untuk dapat menjalankan beban kerja AI generatif mereka tanpa rasa khawatir, sambil tetap memprioritaskan isu privasi, keamanan, dan pengendalian data perusahaan mereka."
"Saat ini, perusahaan-perusahaan tengah berlomba untuk mengintegrasikan AI generatif ke dalam bisnis mereka,” tambah Jensen Huang, pendiri dan CEO Nvidia.
“Kolaborasi yang lebih luas dengan VMware ini akan menghadirkan solusi perangkat lunak dan komputasi yang diperlukan oleh ratusan ribu pelanggan dari berbagai sektor - mulai dari layanan keuangan, perawatan kesehatan, hingga manufaktur – untuk membuka potensi AI generatif menggunakan aplikasi yang dikembangkan dengan data internal perusahaan masing-masing."
Untuk mencapai keuntungan bisnis lebih cepat, perusahaan terus berupaya mengefisienkan proses pengembangan, pengujian, dan penerapan aplikasi AI generatif. Menurut perkiraan McKinsey, penggunaan AI generatif dapat berkontribusi hingga USD4,4 triliun setiap tahunnya pada ekonomi global.
Solusi VMware Private AI Foundation with Nvidia memungkinkan perusahaan untuk memanfaatkan kemampuan tersebut, melakukan kustomisasi large language model; memproduksi model yang lebih aman dan pribadi untuk penggunaan internal; dan menawarkan AI generatif sebagai layanan kepada penggunanya; dan, menjalankan beban kerja inferensi dalam skala besar dengan lebih aman.
Salah satu fitur utama platform ini adalah alat AI terintegrasi yang memungkinkan perusahaan menjalankan model yang telah dilatih menggunakan data pribadi mereka dengan biaya yang lebih efisien.
Platform ini juga menghadirkan fitur Nvidia NeMo, sebuah kerangka kerja cloud-native end-to-end yang terintegrasi dalam Nvidia AI Enterprise — system operasi dari Nvidia AI platform —yang memungkinkan perusahaan untuk membangun, menyesuaikan, dan menerapkan model AI generatif secara virtual dengan mudah.
NeMo menggabungkan kerangka kustomisasi, toolkit Guardrail, alat kurasi data, dan model terlatih untuk menawarkan cara yang mudah, hemat biaya, dan cepat bagi perusahaan untuk mengadopsi AI generatif.
Untuk menerapkan AI generatif dalam produksi, NeMo menggunakan TensorRT for Large Language Models (TRT-LLM), yang mempercepat dan mengoptimalkan performa inferensi pada LLM terbaru pada GPU Nvidia.
Dengan NeMo, VMware Private AI Foundation with Nvidia akan memungkinkan perusahaan-perusahaan memanfaatkan data mereka sendiri untuk membangun dan menjalankan model AI generatif khusus pada infrastruktur cloud hybrid VMware.
Pada acara VMware Explore 2023, Nvidia dan VMware mendemonstrasikan bagaimana developer dapat memanfaatkan Nvidia AI Workbench untuk mengambil model komunitas seperti Llama 2 (tersedia di Hugging Face), lalu melakukan kustomisasi secara remote dan kemudian meluncurkan AI generatif berskala produksi dalam lingkungan VMware
VMware Private AI Foundation with Nvidia akan didukung oleh Dell Technologies, Hewlett Packard Enterprise, dan Lenovo – sebagai pionir dalam menawarkan sistem yang meningkatkan beban kerja penyesuaian dan inferensi LLM perusahaan dengan GPU Nvidia L40S, DPU Nvidia BlueField-3 dan SmartNIC Nvidia ConnectX-7.
GPU Nvidia L40S memungkinkan performa inferensi AI generatif hingga 1,2x lebih baik dan performa pelatihan hingga 1,7x lebih baik dibandingkan dengan GPU Nvidia A100 Tensor Core.
DPU Nvidia BlueField-3 mempercepat, meng-offload, serta mengisolasi beban komputasi yang sangat besar dari virtualisasi, jaringan, penyimpanan, keamanan, dan layanan AI cloud-native lainnya dari GPU atau CPU.
Nvidia ConnectX-7 SmartNIC menghadirkan jaringan yang cerdas dan dipercepat untuk infrastruktur pusat data guna meningkatkan beberapa beban kerja AI yang paling menuntut di dunia.
VMware berencana untuk merilis VMware Private AI Foundation with NVIDIA pada awal tahun 2024.
Cek Berita dan Artikel yang lain di
Google News