Google Buka Teknologi SynthID untuk Umum, Deteksi LLM yang Digunakan AI

Leo Dwi Jatmiko

Kamis, 24 Oktober 2024 | 12:15 WIB

Logo Google di sebuah gedung setelah peluncuran Google El Salvador di San Salvador, El Salvador, 16 April 2024./Reuters

Bisnis.com, JAKARTA - Google membuka pemanfaatan SynthID, teknologi yang dapat mendeteksi large language model (LLM) atau model bahasa yang digunakan oleh kecerdasan buatan (AI), secara luas. Google berupaya mewujudkan penggunaan AI yang bertanggung jawab.

Wakil Presiden Penelitian di Google DeepMind Pushmeet Kohli mengatakan para pengembang AI kini dapat menggunakan teknologi SynthID untuk mendeteksi asal model bahasa yang digunakan oleh AI.

SynthID bekeja dengan memberikan watermark terkait model bahasa yang digunakan sebuah sistem AI.

Baca Juga Komite Perpres Publisher Rights Pacu Percepatan Kerja Sama dengan Google Cs

“Teknologi ini membantu mereka mendeteksi apakah keluaran teks berasal dari [model bahasa besar/LLM] mereka sendiri, sehingga memudahkan lebih banyak pengembang untuk membangun AI secara bertanggung jawab,” kata Pushmeet dilansir dari The Verge, Kamis (24/10/2024).

Google akan memberikan watermark untuk teks berbasis AI. Watermark telah menjadi alat yang makin penting karena model bahasa yang besar digunakan untuk menyebarkan misinformasi politik, menghasilkan konten seksual tanpa persetujuan, dan untuk tujuan jahat lainnya.

Pemerintah California sudah mempertimbangkan untuk menjadikan watermark AI sebagai hal yang wajib, begitu pun dengan pemerintah China yang mewajibkannya tahun lalu. Namun, alat tersebut masih dalam tahap pengembangan di China dan California.

Baca Juga Usai Serangan Siber, Google Maps Bahrain Juga Diacak-acak Netizen

SynthID, yang diumumkan Agustus lalu, membantu membuat output yang dihasilkan AI dapat dideteksi dengan menambahkan watermark yang tidak terlihat ke dalam gambar, audio, video, dan teks saat dihasilkan.

LLM menghasilkan teks satu token pada satu waktu. Token ini dapat mewakili satu karakter, kata, atau bagian dari frasa. Untuk membuat rangkaian teks yang koheren, model memprediksi token yang paling mungkin dihasilkan berikutnya. Prediksi ini didasarkan pada kata-kata sebelumnya dan skor probabilitas yang diberikan pada setiap token potensial.

Sebagai contoh, dengan frasa “Hewan peliharaan terfavorit adalah __.” LLM mungkin mulai melengkapi kalimat dengan token “kucing,” “anjing,” “kelinci,” atau “ikan,” dan setiap token diberi skor probabilitas.

Baca Juga Google Bakal Suntik Dana Rp1,7 Triliun, Selamatkan Jurnalisme di California AS

Jika ada berbagai token yang dapat dipilih, SynthID dapat menyesuaikan skor probabilitas setiap token yang diprediksi, jika tidak akan mengorbankan kualitas, akurasi, dan kreativitas output.

Proses ini diulangi di seluruh teks yang dihasilkan, sehingga satu kalimat mungkin berisi sepuluh atau lebih skor probabilitas yang disesuaikan, dan satu halaman dapat berisi ratusan. Pola skor akhir untuk kedua pilihan kata model dikombinasikan dengan skor probabilitas yang disesuaikan.