Stability AI Rilis Model AI yang Bisa Ciptakan Musik 6 Menit
Model terbaru Stability AI ini diklaim dapat menciptakan musik berdurasi lebih dari 6 menit. #kumparanTECH

Stability AI, perusahaan di balik model kecedasan buatan (artificial intelligence/AI) populer Stable Diffusion, resmi meluncurkan model audio terbaru bernama Stability Audio 3.0. Perusahaan mengklaim model terbarunya ini mampu menghasilkan musik berkualitas profesional dengan durasi lebih dari enam menit.
Stability AI memperkenalkan empat model baru di bawah lini Stability Audio 3.0, yakni small SFX dengan 459 juta parameter, small dengan 459 juta parameter, medium dengan 1,4 miliar parameter, serta large dengan 2,7 miliar parameter.
Dua model kecil, yaitu small SFX dan small, dirancang untuk pembuatan efek suara dan musik langsung di perangkat dengan durasi hingga dua menit. Sementara itu, model medium dan large mampu menciptakan komposisi musik penuh berdurasi 6 menit 20 detik dengan struktur musik dan melodi yang tetap konsisten. Durasi tersebut lebih dari dua kali lipat kemampuan Stable Audio 2.0 yang dirilis pada 2024.
Stability AI juga membuka akses model small SFX, small, dan medium dengan open weights sehingga dapat digunakan dan dimodifikasi siapa saja.
Sebelumnya, pada 2024, perusahaan merilis Stable Audio Open yang hanya mampu menghasilkan musik hingga 47 detik. Kehadiran keluarga model baru ini dianggap sebagai lompatan besar dibanding versi terbuka sebelumnya.
Adapun model large hanya tersedia melalui layanan API dan self-hosting berbayar. Perusahaan dengan pendapatan lebih dari 1 juta dolar AS juga diwajibkan membeli lisensi enterprise.

Persaingan di industri AI musik sendiri kini semakin ketat. Sejumlah perusahaan seperti Google dan ElevenLabs juga terus mengembangkan model dan alat pembuat musik berbasis AI.
Namun, sengketa hukum yang tengah dihadapi Suno dan Udio menunjukkan bahwa lisensi data dan kerja sama dengan label musik kemungkinan akan menjadi faktor penting bagi keberlangsungan layanan AI musik di masa depan.
Tahun lalu, Stability AI telah menandatangani kerja sama dengan Warner Music Group dan Universal Music Group untuk mengembangkan model serta alat kreasi musik berbasis AI.
Perusahaan menyebut seluruh model audio terbarunya dibangun menggunakan data yang telah memiliki lisensi resmi.
Selain itu, startup AI tersebut juga tengah mengembangkan rangkaian produk baru untuk musisi profesional, meski belum mengungkap detail fitur yang akan dibawa.
Untuk memperkuat divisi musik profesionalnya, Stability AI merekrut Ethan Kaplan, mantan chief digital officer di Universal Audio dan Fender. Langkah merekrut eksekutif industri musik juga dilakukan sejumlah perusahaan AI lain. Awal tahun ini, Suno menunjuk mantan CEO Merlin, Jeremy Sirota, sebagai chief commercial officer.
Sementara itu, ElevenLabs merekrut Derek Cournoyer dari penerbit musik independen Kobalt Music untuk memimpin strategi bisnis musik mereka.