
a stability ai apresentou oficialmente a série stability audio 3.0 de modelos de geração de áudio, marcando um novo marco na geração de música por ia — sua versão principal suporta a produção de composições de qualidade profissional com mais de seis minutos de duração, apresentando estrutura completa e estilo consistente.
a família de modelos recém-lançada compreende quatro arquiteturas distintas: as versões leve e padrão pequena do xfs, com 45,9 milhões de parâmetros; uma versão de tamanho médio, com 1,4 bilhão de parâmetros; e uma versão grande, flagship, que conta com 2,7 bilhões de parâmetros. entre elas, os dois modelos menores foram otimizados para implantação em dispositivos edge, permitindo a geração local em tempo real de efeitos sonoros e peças musicais curtas, com até dois minutos de duração. já os modelos médio e grande trazem avanços significativos na modelagem temporal e na consistência estrutural, capazes de gerar obras contínuas de até 6 minutos e 20 segundos, com transições naturais entre seções musicais, tonalidade estável e forte coesão temática — mais do que dobrando a duração máxima em comparação com a versão anterior, stability audio 2.0.
a estratégia de código aberto continua priorizando a inovação impulsionada pela comunidade: o modelo sfx de pequeno porte, assim como as versões pequena e média, disponibilizaram integralmente seus pesos e código-fonte, permitindo download gratuito, ajuste fino e uso comercial. no entanto, o modelo grande, o mais poderoso, permanece indisponível para implantação local; seu acesso está restrito a interfaces api e serviços hospedados na nuvem, sendo necessário que empresas com receitas anuais superiores a um milhão de dólares assinem um contrato de licença comercial antes de obter permissão para utilizá-lo.
no que diz respeito à conformidade de dados, a stability ai concluiu importantes preparativos — estabeleceu parcerias estratégicas com a warner music group e a universal music group para garantir que todos os dados de treinamento utilizados no stability audio 3.0 provêm de bibliotecas musicais legalmente licenciadas, mitigando assim os riscos de direitos autorais desde a origem.
ao mesmo tempo, a empresa acelera sua expansão no ecossistema profissional de áudio, convidando ethan kaplan, ex-diretor digital da universal audio e da fender, a integrar a equipe e liderar o desenvolvimento de uma nova geração de ferramentas criativas baseadas em ia, especialmente projetadas para músicos profissionais.