Mengubah Bahasa Isyarat dalam Panggilan Video? Mengapa Tidak

Newswire
Senin, 5 Oktober 2020 | 08:44 WIB
Pengawas mendampingi siswa tuna rungu dengan bahasa isyarat saat mengikuti Ujian Nasional Berbasis Kertas dan Pensil (UNBKP) di Sekolah Luar Biasa (SLB), Kabupaten Batang, Jawa Tengah, Senin (8/4)./Antara
Pengawas mendampingi siswa tuna rungu dengan bahasa isyarat saat mengikuti Ujian Nasional Berbasis Kertas dan Pensil (UNBKP) di Sekolah Luar Biasa (SLB), Kabupaten Batang, Jawa Tengah, Senin (8/4)./Antara
Bagikan

Bisnis.com, JAKARTA — Penelitian terbaru dari Google kini memungkinkan bahasa isyarat untuk diubah dalam bahasa dalam panggilan video.

Google mengembangkan mesin pendeteksi bahasa isyarat secara waktu nyata yang dapat mengetahui kapan seseorang mulai dengan bahasa isyarat dan kapan mereka selesai (tidak hanya mendeteksi suara).

Sistem tersebut dimungkinkan dengan latensi yang sangat kecil, menurut laporan TechCrunch, dikutip Senin (5/10/2020. Latensi berpengaruh besar untuk mendeteksi bahasa isyarat agar video tidak tertunda atau kualitasnya terdegradasi sehingga Google membuat sistem yang ringan dan dapat diandalkan.

Sistem tersebut pertama-tama menjalankan video model yang dinamai PoseNet, yang dapat memperkirakan posisi tubuh dan anggota badan.

Informasi visual yang disederhanakan ini (pada dasarnya dengan garis) dikirim ke sistem yang dilatih data pose dari video orang yang menggunakan bahasa isyarat Jerman, dan membandingkan gambar langsung dengan tampilan garis yang dihasilkan dari gerakan.

Proses sederhana ini sudah menghasilkan akurasi 80 persen dalam memprediksi apakah seseorang menggunakan bahasa isyarat atau tidak dan dengan beberapa pengoptimalan tambahan mendapatkan akurasi hingga 91,5 persen.

Dibandingkan dengan bagaimana deteksi "ucapan aktif" pada sebagian besar panggilan video hanya dapat mengetahui apakah seseorang berbicara, bahkan tidak tidak bisa membedakan batuk, angka-angka tersebut terbilang cukup baik.

Untuk bekerja tanpa menambahkan sinyal "seseorang sedang menggunakan bahasa isyarat" ke dalam panggilan, sistem menggunakan trik cerdas, dengan menggunakan sumber audio virtual untuk menghasilkan nada 20 kHz, yang berada di luar jangkauan pendengaran manusia, tetapi diperhatikan oleh sistem audio komputer.

Sinyal ini dihasilkan setiap kali orang tersebut menggunakan bahasa isyarat, membuat algoritme deteksi ucapan "berpikir" bahwa mereka sedang berbicara dengan suara keras. Saat ini, sistem tersebut masih dalam tahap demo.

 

Simak berita lainnya seputar topik artikel ini di sini:

Penulis : Newswire
Editor : Zufrizal
Sumber : Antara
Bagikan

Artikel Terkait

Berita Lainnya

Berita Terkini

Nyaman tanpa iklan. Langganan BisnisPro

Nyaman tanpa iklan. Langganan BisnisPro

Terpopuler

Topik-Topik Pilihan

Nyaman tanpa iklan. Langganan BisnisPro

Nyaman tanpa iklan. Langganan BisnisPro

Rekomendasi Kami

Scan QR Code Bisnis Indonesia e-paper