Sebagian besar filter komentar saat ini mengandalkan kombinasi dari istilah yang masuk dalam daftar hitam, kalimat ekspresi umum, dan petunjuk syntax untuk menemukan pernyataan kebencian di ranah online. Namun, tim Yahoo mengaplikasikan mesin pembelajaran pada data komentar yang ditandainya tersebut.
Engadget melaporkan, Yahoo menggunakan teknik bernama "word embedding", yang memproses kata sebagai vektor, tidak hanya sebagai hal positif atau negatif. Sistem Yahoo ini dapat mengenali kalimat menyinggung, bahkan jika masing-masing kata tidak memiliki muatan negatif sekalipun.
Menurut temuannya, sistem akan dapat mengidentifikasi bahasa kurang pantas dari data yang sama dengan benar, dengan presentase akurasi hingga 90 persen. Namun, algoritma ini dinilai tidak akan pernah sempurna seiring dengan perubahan dan penggunaan tata bahasa dari kalimat kurang pantas yang digunakan oleh masyarakat.
Sementara itu, Alex Krasodomski-Jones, peneliti tindak kekerasan online bekerja sama dengan Center of Analysis of Social Media Inggris, mengungkap kepada Technology Review, "Pada 10 tweet, sekelompok manusia akan kesulitan untuk mencapai kata sepakat terkait dengan ciri dari kalimat menyinggung, sehingga Anda dapat membayangkan betapa sulitnya hal tersebut untuk sebuah komputer."
Cek Berita dan Artikel yang lain di
Google News
Viral! 18 Kampus ternama memberikan beasiswa full sampai lulus untuk S1 dan S2 di Beasiswa OSC. Info lebih lengkap klik : osc.medcom.id