Prezados, como é de conhecimento geral, recentemente uma onda de jogos dublados por inteligência artificial surgiu na cena RomHacking brasileira, e por meio do esforço de alguns romhackers, jogos como Skyrim, Elden ring e Black puderam mais uma vez alcançar um aspecto glorioso, um brio, para com nós meros gamers e fãs dessas franquias.
Entretanto, tais ferramentas de IA não são tão acessíveis ou fáceis de serem usadas por iniciantes, o que pode frustrar alguns que possuem a intenção de iniciar ou utilizar tais recursos em seus projetos, nesse sentido, gostaria de compartilhar uma ferramenta que possivelmente será do interesse de nosso meio. Trata-se da Coqui TTS que possui uma versão disponível online com interface interativa, a XTTS.
O uso da ferramenta é simples e intuitivo, ao acessar o site da mesma temos as seguintes opções:
- Em Text Prompt é onde colocaremos a fala traduzida do personagem, aquilo que queremos que seja dito em português ou em outra língua desejada.
- Em Language deve ser indicada a língua a do áudio a ser gerada, português 'pt' possivelmente é o que interessa a maioria deste fórum.
- Em Reference Audio deverá ser enviado um arquivo de demonstração da voz a ser clonada, não é necessário que esteja em português, mas é recomendado que seja um áudio puro sem nenhum som de fundo.
Importante! Repare que alguns formatos irão gerar a mensagem 'Erro' ao iniciar o processo, isso ocorre, pois alguns jogos utilizam codecs e compressões diferentes, eu recomendo que vocês convertam o áudio de demonstração para .wav com codificação Signed 16-bit PCM, tal formato está disponível em softwares como o Audacity/Tenacity.
- Em Use Microphone for Reference você pode gravar um áudio do seu microfone caso deseje clonar a própria voz ou de outra pessoa.
Quanto as caixas de seleção:
☑️ Use Microphone: Marque-a para usar o microfone como fonte do áudio de referência.
☑️ Cleanup Reference Voice: Marque-a para casos que o áudio de referência possuir ruídos, ela tentará melhorar isso.
☑️ Do not use language auto-detect: Marque-a para desativar o autorreconhecimento da língua do áudio de referência.
☑️ Agree: Marque-a para concordar com os termos de uso da aplicação.
Feita a configuração desejada basta apertar em Send e aguardar o processo ser concluído, um áudio será gerado tanto em .wav quanto em .mp4, talvez seja necessário trabalhar ele em algum software de edição como o Audacity/Tenacity e possívelmente será necessário gerar o áudio diversas vezes até obter um resultado satisfatório.
No mais é isso, a ferramenta se encontra no seguinte endereço:
https://huggingface.co/spaces/coqui/xtts
caso esteja fora do ar, utilize algum dos espelhos abaixo:
[spoiler]
https://huggingface.co/spaces/Olivier-Truong/XTTS_V2_CPU_working
https://huggingface.co/spaces/kerncraze/XTTS_V1_CPU
[/spoiler]
Vale apena a usar? Tire suas próprias conclusões:
espero que seja útil para o propósito de vocês e que 2024 seja recheado de novas dublagens!
Feliz ano novo para vocês pessoal, Deus abençoe cada um de vocês, bem como suas famílias.
Entretanto, tais ferramentas de IA não são tão acessíveis ou fáceis de serem usadas por iniciantes, o que pode frustrar alguns que possuem a intenção de iniciar ou utilizar tais recursos em seus projetos, nesse sentido, gostaria de compartilhar uma ferramenta que possivelmente será do interesse de nosso meio. Trata-se da Coqui TTS que possui uma versão disponível online com interface interativa, a XTTS.
O uso da ferramenta é simples e intuitivo, ao acessar o site da mesma temos as seguintes opções:
- Em Text Prompt é onde colocaremos a fala traduzida do personagem, aquilo que queremos que seja dito em português ou em outra língua desejada.
- Em Language deve ser indicada a língua a do áudio a ser gerada, português 'pt' possivelmente é o que interessa a maioria deste fórum.
- Em Reference Audio deverá ser enviado um arquivo de demonstração da voz a ser clonada, não é necessário que esteja em português, mas é recomendado que seja um áudio puro sem nenhum som de fundo.
Importante! Repare que alguns formatos irão gerar a mensagem 'Erro' ao iniciar o processo, isso ocorre, pois alguns jogos utilizam codecs e compressões diferentes, eu recomendo que vocês convertam o áudio de demonstração para .wav com codificação Signed 16-bit PCM, tal formato está disponível em softwares como o Audacity/Tenacity.
- Em Use Microphone for Reference você pode gravar um áudio do seu microfone caso deseje clonar a própria voz ou de outra pessoa.
Quanto as caixas de seleção:
☑️ Use Microphone: Marque-a para usar o microfone como fonte do áudio de referência.
☑️ Cleanup Reference Voice: Marque-a para casos que o áudio de referência possuir ruídos, ela tentará melhorar isso.
☑️ Do not use language auto-detect: Marque-a para desativar o autorreconhecimento da língua do áudio de referência.
☑️ Agree: Marque-a para concordar com os termos de uso da aplicação.
Feita a configuração desejada basta apertar em Send e aguardar o processo ser concluído, um áudio será gerado tanto em .wav quanto em .mp4, talvez seja necessário trabalhar ele em algum software de edição como o Audacity/Tenacity e possívelmente será necessário gerar o áudio diversas vezes até obter um resultado satisfatório.
No mais é isso, a ferramenta se encontra no seguinte endereço:
https://huggingface.co/spaces/coqui/xtts
caso esteja fora do ar, utilize algum dos espelhos abaixo:
[spoiler]
https://huggingface.co/spaces/Olivier-Truong/XTTS_V2_CPU_working
https://huggingface.co/spaces/kerncraze/XTTS_V1_CPU
[/spoiler]
Vale apena a usar? Tire suas próprias conclusões:
espero que seja útil para o propósito de vocês e que 2024 seja recheado de novas dublagens!
Feliz ano novo para vocês pessoal, Deus abençoe cada um de vocês, bem como suas famílias.