No Voice 3.0, você pode escolher entre os seguintes tipos de vozes
● Vozes padrão: são vozes geradas usando métodos convencionais de síntese de fala, como a concatenação de unidades de som pré-gravadas ou algoritmos simples de modificação de forma de onda. Embora menos avançadas em termos de qualidade e flexibilidade em comparação com as vozes neurais, elas ainda são uma opção disponível.
● Vozes Studio: são geradas usando tecnologias tradicionais de síntese de fala, como a concatenação de unidades de som pré-gravadas. Em geral, elas podem ser menos naturais e expressivas em comparação com as vozes geradas por tecnologias mais avançadas.
● WaveNet: é uma tecnologia de síntese de fala que usa redes neurais profundas para modelar diretamente as ondas de áudio, permitindo a geração de vozes mais naturais e fluidas. As vozes geradas com a WaveNet tendem a ter um alto grau de realismo e expressividade.
● Neural2: é uma tecnologia de síntese de fala baseada em redes neurais, que é uma evolução ou versão aprimorada do WaveNet, acrescentando melhorias na qualidade da fala gerada e na eficiência computacional em comparação com as tecnologias anteriores.
O tipo de voz será selecionado no processo de criação de seu canal de Voice.
Aqui você pode saber mais sobre as diferentes vozes disponíveis.