Bisnis.com, JAKARTA – Baichuan Intelligent, perusahaan besutan salah satu pendiri Sogou Wang Xiaochuan telah merilis model bahasa besar terbarunya yang bernama Baichuan-13B dan berhasil menarik investasi sebesar US$50 juta atau sekitar Rp750,32 miliar.
Bersama proyek-proyek terobosannya, perusahaan yang didirikan Wang setelah hengkang dari Sogou pada 2021 itu digadang-gadang menjadi salah satu pencipta model bahasa besar yang paling menjanjikan di China, menunjukkan dirinya sebagai pesaing perusahaan pengembang LLM lain seperti OpenAI.
Saat ini, penggunaan komersial model pra-pelatihan (Baichuan-13B-Base) masih dibatasi. Model tersedia secara gratis untuk peneliti dan pengembang yang telah mengantongi izin hukum. Namun, Baichuan-13B-Chat yang telah diselaraskan dengan fitur dialog dapat diakses pengguna umum secara terbuka.
Melansir Marktech Post, Selasa (25/7/2023), sebagai model sumber terbuka (open source), Baichuan-13B dibangun menggunakan data dari GitHub.
Baichuan-13B mengikuti desain Transformer yang sama dengan GPT dengan sebagian besar varian adalah buatan China. Dilatih menggunakan data berbahasa China dan Inggris, seluruh parameternya (variabel yang digunakan dalam produksi dan analisis teks) tersedia dalam dua bahasa.
Baichuan-13B dibangun di atas Baichuan-7B dengan meningkatkan jumlah parameter menjadi 13 miliar dan telah melatih 1,4 triliun token pada corpora berkualitas tinggi, yang mana 40 persen lebih banyak dari LLaMA-13B. Dalam ukuran open source 13B, Baichuan-13B menjadi model dengan data pelatihan terbanyak.
Peneliti juga menyediakan versi terkuantisasi int8 dan int4 yang lebih efisien untuk inferensi untuk mendorong penggunaan pengguna secara luas. Kedua versi ini dapat diimplementasikan pada kartu grafis kelas konsumen seperti Nvidia 3090, tetapi versi non-kuantisasi membutuhkan perangkat keras yang jauh lebih kuat.
Meski AS baru-baru ini menetapkan pembatasan terhadap produsen chip kecerdasan buatan atau artificial intelligence (AI) China, varian model ini dapat dijalankan pada perangkat keras konsumen seperti kartu grafis 3090 Nvidia.
Peneliti Baichuan Intelligent Technology mengonfirmasi bahwa grup mereka belum membuat aplikasi berbasis Baichuan-13B untuk platform apapun, termasuk iOS, Android, web, atau lainnya dan mengimbau pengguna tidak menggunakan model Baichuan-13B untuk tujuan ilegal atau berbahaya, seperti membahayakan keamanan nasional atau sosial.
Pengguna juga didorong untuk tidak menggunakan model Baichuan-13B untuk layanan Internet tanpa audit dan pengajuan keamanan yang diperlukan. Imbauan tersebut diharapkan dapat menjaga kemajuan teknologi dalam batas-batas hukum.