OpenAI、テキスト読み上げ技術を革新するために「Voice Engine」をリリース

OpenAI は Voice Engine という画期的な新しいツールを発表しました。これは、任意の15秒の音声サンプルを正確に合成したレプリカに変換することができます。

Voice Engineの可能性は単なる利便性を超えて、親しみのある声でテキストを音声化することで読み書きができない人々にも大きな助けを提供します。さらに、コンテンツクリエーターが本物の声で世界中のオーディエンスにリーチすることを可能にし、言語の壁を取り除くことを約束します。また、医療条件や他の理由で声を失った人々に新しい声を提供します。

Voice Engineは、ChatGPTのようなプラットフォームに統合されたOpenAIの広範なAI主導の革新の一部です。会社は2022年にVoice Engineを初めて開発し、それをテキスト読み上げAPIやChatGPT Voice、Read Aloudで利用可能なプリセットボイスに活用しています。

OpenAIのジェフ・ハリス氏がTechCrunchのインタビューで述べたように、この技術には大きな可能性があるものの、不正使用を軽減するために慎重に展開されています。

この責任ある開発アプローチは、データプライバシーおよび倫理的懸念にも拡大しています。OpenAIは、Voice Engineがライセンスされたデータと公開可能なデータの組み合わせで訓練されていることを保証し、同意なしに個人データを使用しない厳格なポリシーを持っています。