Francuski AI startap Mistral predstavio novi model za pretvaranje teksta u govor: Veoma brz, podržava 9 jezika
Sumirano
- Mistral lansirao model za pretvaranje teksta u govor, Voxtral
- Voxtral podržava devet jezika i prepoznaje naglaske i intonacije
- Model radi u realnom vremenu, počinje govoriti za 90 milisekundi
Francuski startap za razvoj veštačke inteligencije Mistral lansirala je novi model za pretvaranje teksta u govor (TTS) koji može da se koristi u glasovnim asistentima ili za poslovne potrebe, poput korisničke podrške i prodaje.
Model, nazvan Vokstral (Voxtral TTS), stavlja Mistral u direktnu konkurenciju sa kompanijama kao što su Ileven lebs, Dipgram i OpenAI.
Vokstral podržava devet jezika, konkretno engleski, francuski, nemački, španski, holandski, portugalski, italijanski, hindi i arapski.
Model može da prilagodi glas uz uzorak kraći od pet sekundi, prepoznaje naglaske, intonacije i ritam govora, a može i lako da prelazi između jezika bez gubitka karakteristika određenog glasa, prenosi Teh kranč.
Novi model je veoma brz - čim mu se pošalje tekst, počinje da "govori" za svega 90 milisekundi, što znači da suštinski radi u realnom vremenu.
Za generisanje deset sekundi zvuka mu je potrebno oko 1,6 sekundi, nekoliko puta brže od stvarnog trajanja audio - snimka.
Ranije ove godine, Mistral je lansirao modele za transkripciju - jedan za obradu velikih serija podataka, drugi za primenu u realnom vremenu, sa neznatnim kašnjenjem.
Novi TTS model omogućava kompaniji da ponudi kompletnu paletu glasovnih proizvoda za preduzeća.
Mistral se pozicionira kao alternativa konkurenciji jer je otvorenog koda i prilagodljiv, što omogućava kompanijama da modeli glasa budu podešeni prema njihovim potrebama i zahtevima.
Podsetimo, nedavno su predstavnici startapa gostovali u Beogradu. Održali su masterklas u prostorijama Privredne komore Srbije, sa kojom sarađuju na razvoju nacionalne AI platforme i velikog jezičkog modela.
(Ubrzanje.rs/Tanjug)