Stiksar
Администратор
- 49
- 0
- 16
Этот сервис генерирует треки, основываясь на предложенных текстовых описаниях. Он функционирует благодаря Stable Diffusion 1.5 и Torchaudio.
Для этого ИИ сначала создаёт визуальное представление звука (соннограмму), а затем преобразует его в аудио. В сонограмме ось X отображает время, а ось Y — порядок воспроизведения заданных частот.
Насыщенность каждого пикселя соответствует громкости звука.
Этот инструмент сочетает в себе различные звуки и жанры, внося в мелодию элементы соответствующих жанров в соответствии с заданными параметрами.
Скрытое содержимое могут видеть только пользователи групп(ы): Профи