Bisnis.com, JAKARTA – Sejumlah kantor media berita besar dunia termasuk New York Times (NYT) hingga Reuters telah memblokir alat web-crawler milik OpenAI sehingga membatasi kemampuan perusahaan untuk terus mengakses konten mereka.
OpenAI merupakan perusahaan di balik salah satu chatbot kecerdasan buatan atau artificial intelligence (AI) terkenal ChatGPT.
Model AI ChatGPT ditingkatkan dengan alat web-crawler milik perusahaan yang dikenal sebagai GPTBot, yang dapat memindai halaman web lain untuk mengumpulkan informasi.
Melansir dari The Guardian, Jumat (25/8/2023), NYT menjadi media pertama yang dilaporkan telah memblokir GPTBot dari situs webnya.
Mengikuti laporan tersebut, ditemukan sejumlah kantor media lainnya seperti CNN, Reuters, Chicago Tribune, ABC, dan merek Australian Community Media (ACM) seperti Canberra Times dan Newcastle Herald turut melakukan aksi yang sama.
Model bahasa besar atau large language model (LLM) seperti ChatGPT memerlukan informasi dalam jumlah besar untuk melatih sistemnya dan memungkinkan bot menjawab pertanyaan dari pengguna dengan pola bahasa yang menyerupai manusia. Namun perusahaan bot seringnya enggan buka suara mengenai keberadaan materi berhak cipta dalam kumpulan data mereka.
Pemblokiran di GPTBot dapat dilihat di file robots.txt dari situs bersangkutan, yang memberi tahu crawler dari mesin pencari serta entitas lainnya halaman mana yang dapat diakses.
CNN mengonfirmasi bahwa perusahaan telah memblokir GPTBot untuk seluruh judul beritanya, tetapi tidak buka suara perihal apakah merek tersebut berencana untuk mengambil tindakan lebih lanjut mengenai penggunaan kontennya dalam sistem AI.
Juru bicara Reuters juga mengatakan pihaknya secara rutin meninjau robots.txt serta syarat dan ketentuan situsnya. Menurut perusahaan, kekayaan intelektual menjadi sumber kehidupan bisnis mereka sehingga sangat penting untuk melindungi hak cipta atas konte-kontennya..
Selain itu, persyaratan layanan The NYT baru-baru ini diperbarui, sehingga membuat larangan terhadap pengikisan konten (web-crawling) untuk pelatihan dan pengembangan AI menjadi lebih jelas.
Mulai tanggal 3 Agustus, aturan situs webnya secara eksplisit melarang konten penerbit digunakan untuk pengembangan program perangkat lunak apapun, termasuk, tetapi tidak terbatas pada, pelatihan sistem pembelajaran mesin atau AI tanpa izin.
Kantor media berita secara global dihadapkan pada dilema penggunaan AI sebagai bagian dari pengumpulan berita, serta cara menangani konten yang berpotensi dimanfaatkan dalam pelatihan oleh perusahaan yang mengembangkan sistem AI.
Pada awal bulan Agustus ini, berbagai media termasuk Agence France-Presse dan Getty Images menandatangani surat terbuka yang menekan regulasi untuk AI, termasuk transparansi tentang susunan semua perangkat pelatihan yang digunakan untuk membuat model AI serta persetujuan untuk penggunaan materi berhak cipta.
Di samping itu, penelitian dari sebuah perusahaan yang memeriksa keberadaan konten AI bernama OriginalityAI juga menemukan bahwa situs web besar termasuk Amazon dan Shutterstock juga telah memblokir GPTBot. (Lydia Tesaloni Mangunsong)