Meskipun kuat, model fondasi tidak mengetahui cara kerja bisnis Anda. Mereka terbatas pada apa yang mereka ketahui dari data pelatihan mereka, yang seringkali tidak memiliki informasi dan keahlian domain yang diperlukan untuk tugas bisnis dan kasus penggunaan tertentu.
Model AI generatif ini juga memiliki batas pengetahuan, yang berarti mereka tidak menyadari perkembangan dan informasi baru yang terjadi di luar pelatihan mereka. Lebih kritis lagi, kesenjangan dalam pengetahuan ini dapat berkontribusi pada model yang menghasilkan model yang tidak relevan, tidak benar secara faktual, atau, dalam kasus yang lebih jarang, respons yang sepenuhnya dibuat-buat (yaitu, halusinasi).
Sederhananya, model AI generatif dilatih untuk memprediksi jawaban yang paling mungkin berdasarkan data pelatihan, tetapi itu tidak sama dengan mengutip fakta. Untuk membuka potensi penuh gen AI, organisasi perlu membumikan respons model dalam apa yang kita sebut "kebenaran perusahaan" – data dan sistem perusahaan yang segar dan real-time.
Dalam ajang Google Cloud Let's Talk AI 2024, dijelaskan bahwa pendekatan ini memungkinkan model mengambil konteks yang mereka butuhkan dari sistem eksternal, sehingga mereka dapat menemukan informasi terbaru dan paling relevan, alih-alih mengandalkan pengetahuan pelatihan mereka yang terbatas dan berpotensi ketinggalan zaman.
Selama setahun terakhir, grounding telah menjadi yang terdepan dalam banyak percakapan kami dengan organisasi di Indonesia, terutama karena semakin banyak yang beralih dari eksperimen ke dalam produksi Gen AI.
Semakin banyak eksekutif menyadari bahwa model AI generatif hanyalah titik awal. Mereka mengeksplorasi cara menggunakan pendekatan grounding seperti retrieval augmented generation (RAG) untuk menambahkan konteks dari sumber informasi yang dapat diandalkan, data pihak pertama mereka sendiri, dan informasi terbaru dari web.
Membawa fakta ke pengetahuan abstrak
Misalkan Anda ingin membuat agen AI untuk membantu karyawan memilih paket tunjangan yang tepat untuk kebutuhan mereka. Tanpa grounding, agen AI hanya akan dapat secara umum membahas bagaimana tunjangan karyawan yang paling umum bekerja berdasarkan data pelatihannya, tetapi tidak akan memiliki kesadaran tentang manfaat yang ditawarkan organisasi secara spesifik.
Ditambah, jika data pelatihan agen AI mencakup semua tunjangan awal karyawan, elemen program ini selalu berubah. Oleh karena itu, model fondasi akan dengan cepat kedaluwarsa tanpa cara untuk mereferensikan informasi yang baru diperbarui. Untuk secara otomatis mengaktifkan agen AI untuk mengambil informasi faktual yang relevan, Anda memerlukan beberapa bentuk pembumian, seperti RAG.
Dalam skenario ini, RAG dapat menghubungkan model Anda untuk merencanakan kebijakan, ringkasan manfaat terperinci, kontrak operator, dan dokumentasi relevan lainnya. Hal ini memungkinkan agen AI untuk menjawab pertanyaan tertentu, memberikan rekomendasi, atau mendaftarkan karyawan secara langsung melalui portal online – semuanya tanpa perlu melatih ulang atau menyempurnakan model fondasi.
Keuntungan ini menjadikan RAG pendekatan utama bagi organisasi yang ingin membumikan aplikasi dan agen AI generasi mereka dalam kebenaran perusahaan. Ada beberapa cara berbeda untuk memasukkan RAG ke dalam gen AI, mulai dari pendekatan yang lebih sederhana seperti menautkan model langsung ke internet untuk kebaruan hingga sistem RAG yang dibuat khusus yang lebih kompleks.
Grounding gen AI harus mudah
Di Google Cloud, kami percaya bahwa mendasarkan respons pada kebenaran perusahaan adalah kunci untuk mengadopsi AI generatif dengan kecepatan penuh. Organisasi tidak hanya membutuhkan model fondasi yang luar biasa, mereka membutuhkan kemampuan yang memberdayakan mereka untuk menambah data pelatihan mereka dengan RAG dari berbagai data dan informasi segar yang andal. Dan mereka juga membutuhkannya agar mudah diterapkan.
Sebagian besar pekerjaan kami baru-baru ini dan yang sedang berlangsung difokuskan untuk menjadikan RAG sebagai kenyataan yang dapat dicapai bagi semua orang. Vertex AI hadir dengan kemampuan grounding untuk berbagai kebutuhan, termasuk membangun alur kerja RAG khusus untuk pengambilan, peringkat, dan pemrosesan dokumen untuk memudahkan membumikan model AI gen dalam data pribadi.
Untuk respons yang lebih faktual di industri yang sangat diatur atau intensif data seperti layanan kesehatan atau keuangan, ada mode high-fidelity, yang hanya sumber informasi untuk pembuatan respons dari konteks yang Anda berikan, bukan 'pengetahuan dunia' model, untuk mempercepat waktu respons dan memastikan tingkat faktualitas yang lebih tinggi.
Kami juga baru-baru ini meluncurkan kemampuan untuk membumikan model AI generatif di Google Seacrh – salah satu sumber informasi segar, faktual, dan berkualitas tinggi paling tepercaya di dunia. Selain itu, kami bekerja sama dengan penyedia khusus, seperti Moody's, MSCI, Thomson Reuters, dan Zoominfo untuk memungkinkan integrasi lebih banyak kumpulan data eksternal yang andal.
Kita berada di era AI generasi yang siap untuk perusahaan, ketika akurasi, ketepatan waktu, dan kontekstualisasi sekarang menjadi persyaratan yang tidak dapat dinegosiasikan. Dengan kemampuan dan integrasi grounding berbasis platform yang kuat yang semakin tersedia, menggabungkan RAG ke dalam sistem gen AI akan memperluas kemampuan organisasi untuk mengatasi kasus penggunaan yang menuntut pengetahuan khusus domain dan kesadaran kontekstual yang mendalam.
(Fanly Tanto, Country Director, Indonesia, Google Cloud)
Cek Berita dan Artikel yang lain di
Google News