Bisnis.com, JAKARTA - Meta perusahaan induk Facebook merilis sejumlah model kecerdasan buatan (artificial intelligence/AI) baru, salah satunya model “Self-Taught Evaluator”, yang dapat memperkecil keterlibatan manusia dalam proses pengembangan AI.
Melansir dari Reuters, model AI ini mulai diperkenalkan saat peluncuran makalah Meta pada Agustus lalu. Model ini diketahui menggunakan teknik "rantai pemikiran" yang digunakan oleh model AI OpenAI.
Teknik ini melibatkan pemecahan masalah yang kompleks menjadi langkah-langkah logis yang lebih kecil dan meningkatkan akurasi respons pada masalah dalam mata pelajaran seperti sains, pengodean, dan matematika.
Adapun, para peneliti Meta sudah melatih AI ini untuk menghasilkan data guna mengurangi keterlibatan manusia dalam pengolahan data.
AI ini memang diproyeksikan mampu menjalankan berbagai tugas tanpa memerlukan intervensi manusia, memberikan kemungkinan untuk mengurangi kebutuhan akan metode Pembelajaran Penguatan dari Umpan Balik Manusia (RLAIF), yang saat ini masih digunakan.
Proses RLAIF melibatkan pencatat manusia yang harus memiliki keahlian khusus untuk memberi label data dan memverifikasi jawaban, terutama pada soal-soal kompleks.
Pemanfaatan AI sebagai asisten digital yang cukup cerdas untuk menjalankan berbagai tugas tanpa campur tangan manusia menjadi salah satu hal yang selalu dibayangkan para peneliti.
"Kami berharap, seiring AI menjadi semakin manusiawi, AI akan menjadi semakin baik dalam memeriksa pekerjaannya, sehingga AI benar-benar akan lebih baik daripada manusia pada umumnya," kata peneliti Meta, Jason Weston melansir Reuters, Selasa (22/10/2024).
Tak hanya merilis AI, Meta juga merilis beberapa pembaruan pada model identifikasi gambar Segment Anything milik perusahaan, atau sebuah alat yang mempercepat waktu pembuatan respons LLM dan kumpulan data yang dapat digunakan untuk membantu penemuan bahan anorganik baru.
Diketahui, tak hanya Meta yang mengeksplorasi konsep RLAIF ini, namun ada perusahaan seperti Google dan Anthropic juga telah menerbitkan penelitian tentang konsep RLAIF, atau Reinforcement Learning from AI Feedback.
Akan tetapi, tidak seperti Meta, perusahaan-perusahaan tersebut cenderung tidak merilis model mereka untuk digunakan oleh publik.