Hasil riset ini diklaim berdasarkan pengamatan interaksi dengan model AI ChatGPT‑4o. Mereka menilai bahwa AI mampu memberikan jawaban lebih akurat ketika diberi perintah dengan nada kasar dibanding nada sopan.
Akurasi tertinggi diukur pada prompt “very rude” mencapai 84,8 %, sementara untuk prompt “very polite” hanya 80,8 %, menurut hasil riset yang dibagikan situs Live Science.
Para peneliti mengubah nada 50 soal pilihan ganda menjadi lima kategori (very polite, polite, neutral, rude, very rude) lalu menjalankannya 10 kali tiap soal pada ChatGPT-4o. Mereka menemukan bahwa akurasi meningkat secara bertahap dari nada sangat sopan ke sangat kasar.
Eksperimen dan Temuan Utama
Dalam eksperimen tersebut, tim riset menyajikan 250 soal yaitu 50 soal yang masing-masing diberikan dalam 5 nada berbeda meliputi mata pelajaran seperti matematika, sejarah, dan sains. Model diinstruksikan memilih satu dari empat opsi jawaban.Mereka menegaskan bahwa tone atau nada perintah bisa berpengaruh ke performa jawaban AI berdasarkan metode pengukuran tadi.
Meski hasilnya unik dan menarik, para peneliti dengan jelas menyatakan bahwa temuan ini belum bisa digeneralisasi untuk semua model AI atau konteks penggunaan. Mereka mencatat bahwa dataset mereka terbatas dan hanya menggunakan satu model besar bahasa saja.
Lebih lanjut, mereka memperingatkan bahwa meskipun nada kasar bisa meningkatkan angka akurasi dalam eksperimen terbatas ini, perilaku tersebut tidak serta-merta direkomendasikan untuk interaksi sehari-hari dengan AI.
Mirip dengan interaksi manusia, perintah kasar akan berpengaruh ke gaya komunikasi AI yang juga buruk. Temuan ini menyentuh bidang prompt engineering, bagaimana struktur, gaya, dan nada prompt mempengaruhi kinerja model AI.
Cek Berita dan Artikel yang lain di
Google News
Viral! 18 Kampus ternama memberikan beasiswa full sampai lulus untuk S1 dan S2 di Beasiswa OSC. Info lebih lengkap klik : osc.medcom.id