Nvidia (NVDA) ogłosił nowe dzieło Model audio AI „Fugatto”w tym tygodniu możesz użyć dowolnej kombinacji plików tekstowych i audio, aby wyprodukować lub przekształcić „dowolną kombinację muzyki, mowy i dźwięków opisanych w podpowiedzi”.
Według Nvidii Fugatto oznacza Foundational Generative Audio Transformer Opus 1.
Dzięki nowemu modelowi użytkownicy mogą wprowadzać podpowiedzi tekstowe, aby generować fragmenty muzyki, usuwać lub dodawać instrumenty z istniejących utworów, zmieniać akcenty wokalne i emocje, a nawet tworzyć dźwięki, jakich nigdy wcześniej nie słyszałeś. .
„Fugatto to pierwszy podstawowy model generatywnej sztucznej inteligencji, który wykazuje zdolność łączenia nowych właściwości (możliwości wynikających z interakcji różnych wyszkolonych umiejętności) z instrukcjami w dowolnej formie” – powiedziała Nvidia.