Mengutip Techradar, ketiga prompt gambar itu terdiri dari satu untuk subyek, satu untuk pemandangan, dan satu untuk gaya. Whisk akan mengurus sisanya, menjadikannya sebagai cara lebih intuitif untuk bereksperimen dengan ide berbeda.
Sebagian besar alat penghasil gambar AI terbaik mengharuskan pengguna untuk menulis prompt mendetail, namun Whisk menangani hal di latar belakang. Saat pengguna menjatuhkan gambar ke antarmuka Whisk berbasis web sebagai inspirasi, model Google Gemini akan secara otomatis menganalisanya dan menulis secara detail caption untuk masing-masing gambar.
Kemudian gambar ini akan dialihkan ke model Imagen 3, untuk menciptakan gambar yang selaras. Sebagai contoh, pengguna dapat memberikan gambar mobil sebagai subyek dan foto pedesaan sebagai pemandangan.
Pengguna dapat menambahkan efek cat air sebagai gaya yang ingin Whisk buat. Lalu tekan tombol dan pengguna akan mendapatkan sepasang gambar berdasarkan input mereka. Antarmuka ini juga memungkinkan pengguna memberikan detail berbasis teks tambahan lebih spesifik untuk mengubah hasil.
Selain itu, pengguna juga dapat dengan mudah memberikan gambar dari sumber berbeda atau memilih secara acak jika membutuhkan inspirasi. Hasil baru akan muncul sebagai pasangan di feed, menjadikannya sebagai cara lebih intuitif untuk merancang.
Pengguna juga dapat memilih untuk menyaring gambar dengan mengungkap prompt teks dan menambahkan lebih banyak detail. Kendati Whisk dirancang untuk mengeliminasi kebutuhan prompt berbasis teks, Google menghadirkan opsi untuk menyaring prompt tertulis, karena hasil tidak akan selalu sama dengan material sumber.
Dalam unggahan di blog terkait alat eksperimental ini, Google menjelaskan bahwa Whisk menangkap intisari dari subyek, dan bukan replika. Kemampuan ini sama efektifnya dengan analisis Gemini dari gambar yang diberikan pengguna.
Lebih lanjut, unggahan ini menjelaskan bahwa karena Whisk mengekstraksi hanya beberapa karakteristik utama dari gambar, alat ini berpeluang menghasilkan gambar berbeda dari ekspektasi pengguna. Karenanya, Google memungkinkan pengguna untuk meninjau dan mengedit prompt terkait kapanpun.
Kendati memiliki sejumlah kekurangan, Whisk merupakan aplikasi menarik dari alat AI Google yang telah tersedia. Model generatif yang mendukungnya sama dengan model pendukung Gemini saat pengguna berbincang via antarmuka teks.
Namun dengan mengandalkan input gambar, Whisk akan lebih mudah diakses dan menjadi cara lebih intuitif untuk kreator visual guna mewujudkan ide mereka. Berdasarkan umpan balik awal dari pihak kreatif di ranah digital, Google mengacu Whisk sebagai tipe baru dari alat kreatif.
Google menyebut alat baru ini ditujukan untuk eksplorasi visual rapid, dan bukan edit dengan kesempurnaan piksel. Sayangnya, Google Whisk saat ini hanya tersedia untuk pengguna di Amerika Serikat, yang dapat dicoba via situs labs.google/whisk.
Alat eksperimental ini sepenuhnya ditawarkan secara gratis, dan data dari pengalaman dengan Whisk akan diberikan kepada Google guna membantu menyaring dan mengembangkan produk AI masa depan.
Cek Berita dan Artikel yang lain di
Google News