Microsoft VibeVoice: 長尺対話音声を生成するオープンモデル microsoft/VibeVoice
AI要約 MicrosoftがGitHubで公開した音声合成モデルVibeVoiceは、最大90分・4話者の対話音声を生成可能。MITライセンスで提供されたが、悪用懸念を理由に後日リポジトリが削除された経緯が紹介されている。
EN Microsoft's VibeVoice is an open TTS model capable of generating up to 90 minutes of multi-speaker conversational audio with up to 4 voices. Released under MIT, the GitHub repo was later taken down over misuse concerns.
media