A Stability AI anunciou nesta semana uma ferramenta de inteligência artificial (IA) generativa de texto para áudio, o Stable Audio. A plataforma é capaz de gerar músicas e outros clipes de áudio, permitindo controle sobre o conteúdo e a duração do arquivo gerado.
Durante o treinamento, o modelo de IA recebeu um conjunto de dados com mais de 800 mil arquivos de áudio, incluindo músicas, efeitos sonoros e faixas com o instrumentos isolados, bem como metadados de texto correspondentes, fornecidos por meio de um acordo com o fornecedor de música stock AudioSparx. Este conjunto de dados soma mais de 19.500 horas de áudio.
Tela da plataforma Stable Audio