新モデル発表 / Google AI Blog / NEWS
Gemini 3.1 Flash TTS発表、70言語対応の音声生成モデル
Googleが音声タグで表現力を制御できるAI音声生成モデル「Gemini 3.1 Flash TTS」を発表。70言語以上に対応し、SynthID透かしで生成音声を識別。
キーポイント
- 音声タグで話し方や速度を自然言語で制御可能
- 70言語以上のマルチリンガル対応
- SynthID透かしで AI生成音声を識別
- Google AI Studio、Vertex AI、Google Vidsで利用可能
音声タグの導入により、開発者は複雑なプロンプトなしで表現力豊かな音声生成を細かく制御できる。
💡 ビジネス活用ポイント
70言語の音声生成で、グローバルカスタマーサポートやコンテンツ制作のコスト削減が実現できる
- 🏢Claude APIと連携し、多言語チャットボットの音声応答をVertex AIで自動生成。カスタマーサポート業務を効率化
- 🤝中小企業向けに多言語音声ナレーション制作サービスをGoogle Vidsで提供。翻訳・配信コストを削減提案
- 👁Google・Anthropicが音声AI競争激化。生成音声品質と多言語対応が差別化要因になる局面