Meta は AudioCraft (オープンソースのAI搭載プラットフォームで、ユーザーがテキストプロンプトのみに基づいて音楽や音を作成できる技術) を導入しました。この革新的な技術は、単純なノイズの生成から複雑なメロディの作成まで、生成AIの能力によって幅広い可能性を提供します。
Today we're sharing details on AudioCraft, a new family of generative AI models built for generating high-quality, realistic audio & music from text. AudioCraft is a single code base that works for music, sound, compression & generation — all in the same place.
— Meta AI (@MetaAI) August 2, 2023
More details ⬇️
AudioCraftは3つのモデルで構成されています。
- MusicGen: このモデルはテキストプロンプトに基づいてメロディを生成します。この目的のためにMetaが所有またはライセンスを取得した20,000時間の音楽で訓練されました。
- AudioGen: テキスト入力から特定の音をシミュレートするために設計されており、犬の鳴き声から人間の足音まで、さまざまな聴覚体験を再現します。公開されている音響効果を元に訓練されています。
- EnCodec: 音を処理し、アーティファクトを減少させることで高品質な音声出力を保証し、不要な歪みを最小限に抑えます。
YouTubeの新しいAI搭載ツールが自動で動画を吹き替え可能に
YouTubeは動画コンテンツを世界中でよりアクセスしやすくするための一歩を踏み出しました。新しいAI搭載ツールはYouTubeプラットフォーム内でコスト効率の高いソリューションを提供し、クリエイターがコンテンツの吹き替え版を国際視聴者に提供できるようにします。

会社はメディア代表者にAIプラットフォームが生成したサンプル音声クリップをプレビューする許可を与えました。口笛、サイレン、環境音などの音は驚くほどのリアリティで再現されました。しかし、ギターの弦の音色などの微妙なニュアンスには、依然としてわずかな人工感があると専門家は指摘しています。