banner

ブログ

Dec 20, 2023

Google の AI を実際に使ってみる

AIはテキストの説明から逆算して一貫した曲を生成できるでしょうか? それが、Google が昨日 I/O カンファレンスのキックオフ中にリリースした AI を活用した音楽作成ツール、MusicLM の前提です。

MusicLM は、さまざまなスタイルで新しい音楽を作成する方法を学習するために数十万時間のオーディオでトレーニングされており、Google の AI Test Kitchen アプリからプレビューで利用できます。 私も数人の同僚と同様に、ここ 1 日ほどこれを使って遊んでいます。

評決? MusicLM がミュージシャンの仕事をすぐに引き受けてくれるわけではないとだけ言っておきましょう。

Test Kitchen で MusicLM を使用するのは非常に簡単です。 アクセスが承認されると、テキスト ボックスが表示され、そこに曲の説明を好きなだけ詳細に入力して、システムに 2 つのバージョンの曲を生成させることができます。 どちらもダウンロードしてオフラインで聴くことができますが、Google では、AI のパフォーマンスを向上させるために、どちらかのトラックを「高評価」することを推奨しています。

画像クレジット:グーグル

私がリリース前の1月に初めてMusicLMを取り上げたとき、私はこのシステムの曲は人間のアーティストが作曲するような音だと書きましたが、必ずしも音楽的に独創性や一貫性があるわけではありませんでした。 今年の初めに採取されたサンプルに関して深刻な選り抜きが行われていたことは明らかであるため、今ではその言葉を完全に支持しているとは言えません。

私が MusicLM で生成したほとんどの曲は、良く言えばまずまずのサウンドですが、悪く言えば 4 歳児が DAW で放任しているようなものです。 私は主に EDM にこだわり、構造と認識できる(そして理想的には心地よい)メロディーを備えたものを生み出そうと努めてきました。 しかし、どんなにまともであっても、たとえ良いものであっても! — MusicLM の曲の始まりが聞こえると、非常に明白で音楽的に不快な方法で壊れる瞬間が来ます。

たとえば、「ダンスに適した、明るく陽気で風通しの良いスタイルの EDM ソング」というプロンプトを使用して生成されたこのサンプルを考えてみましょう。 頭を揺さぶるようなベースラインと古典的なダフト・パンクのシングルの要素を備えたこの曲は、有望な始まりだ。 しかし、トラックの中盤に近づくと、コースから大きく逸れ、実質的には別のジャンルになります。

https://techcrunch.com/wp-content/uploads/2023/05/AI_Test_Kitchen_edm_song_in_a_light_upbeat_and_airy_style_g-2.mp3

これは、よりシンプルなプロンプトからのピアノソロです - 「ロマンチックで感情的なピアノ音楽」。 お気づきかと思いますが、各パートのサウンドは良く、素晴らしいものであり、少なくとも指の動きに関しては例外的です。 しかし、その後、ピアニストはマニアに取り憑かれたような気分になります。 その後、音符がごちゃ混ぜになり、オリジナルの線に沿っているにもかかわらず、まるで新しい楽譜から来たかのように、曲は根本的に異なる方向性を帯びます。

https://techcrunch.com/wp-content/uploads/2023/05/AI_Test_Kitchen_romantic_and_emotional_piano_music.mp3

私は AI がより基本的な構造の曲のほうがやりやすいかもしれないと考えて、試しに MusicLM のチップチューンを試してみました。 サイコロはありません。 結果 (下) は、キャッチーな部分もありましたが、他のサンプルと同様にランダムに終わりました。

https://techcrunch.com/wp-content/uploads/2023/05/AI_Test_Kitchen_house_music_in_chiptune_with_an_energetic_ba.mp3

プラスの面としては、MusicLM は全体として、OpenAI が数年前に AI 音楽ジェネレーターを開発しようとして試みた Jukebox よりもはるかに優れた仕事をしています。 MusicLM とは対照的に、ジャンル、アーティスト、歌詞の断片が与えられれば、ジュークボックスはボーカルを備えた比較的一貫した音楽を生成できますが、ジュークボックスが作成した曲には、繰り返されるコーラスなどの典型的な音楽要素が欠けており、ナンセンスな歌詞が含まれることがよくありました。 MusicLM が制作した曲にはアーティファクトも少なく、忠実度に関しては一般的にステップアップしているように感じられます。

さらに、プロンプト側の人為的な制限のおかげで、MusicLM の有用性は少し制限されています。 特定のミュージシャンのスタイルであっても、アーティストやボーカルをフィーチャーした音楽は生成されません。 「バリー・マニロウのセリフに沿って」のようなプロンプトを入力してみると、エラー メッセージだけが表示されます。

画像クレジット:グーグル

理由はおそらく合法的です。 結局のところ、ディープフェイク音楽は曖昧な法的根拠に基づいており、音楽業界の一部はMusicLMのようなAI音楽ジェネレーターが音楽著作権を侵害していると主張している。 この問題がある程度明確になるまで、そう長くはかからないかもしれない。法廷で進行中のいくつかの訴訟は、音楽生成 AI に関係する可能性が高く、その中には、アーティストの権利なしに AI システムをトレーニングするために作品が使用されるアーティストの権利に関するものも含まれる。知識または同意。 時が教えてくれる。

画像クレジット: 画像クレジット:
共有