Наш новый LLM-based синтез речи.

← Вернуться к статьям

Наш новый LLM-based синтез речи.

21 ноября в 09:07

habr.comтехнологии

21 ноября в 09:07•

habr.com•технологии

Наш новый LLM-based синтез речи. Рассказываем о нашем новом синтезе речи. Мы так и называем его — «новый синтез», или GigaTTS. Под капотом у него GigaChat 3b, аудио адаптер, собственный токенизатор речи и 30 тысяч часов данных. Никаких диффузий. Очень много работы было проделано над обучением модели, на студии и при подготовке данных для обучения. Новый синтез до мурашек естественный. Он говорит как живой человек, умеет смеяться и выражать эмоции со всеми нюансами. По метрикам он обгоняет наши прошлые модели в 2-4 раза, особенн...

Еще статьи из категории

Еще статьи

← Вернуться к статьям