音楽生成AI「Suno」の紹介と使い方

音楽生成AI「Suno」の紹介と使い方

今回は音楽生成AIであるSunoの使い方を書いていく。

Sunoとは?

Suno | AI Music

Suno AI(Suno)は、テキストから高品質な歌曲(メロディ・歌詞・歌声・伴奏)を自動生成できる音楽生成AIサービスである。

アメリカのスタートアップ Suno AI Inc. が開発しており、音楽に関する知識がなくても、誰でも簡単にオリジナル曲を作れるのが特徴だ。

ネット上で非常に優秀だと聞いたので使ってみたが、予想以上に凄かった。

タンバリンしか叩いたことないけど作れたよ!

コードとか知らんでもいけるで

対応デバイス

デスクトップ・ラップトップ・タブレット(Webブラウザ)

WindowsやMac、Linux、ChromeOSを搭載したデスクトップ・ラップトップ・タブレットでWebブラウザから利用可能。

ただしある程度の画面サイズ(横)がないと、インターフェースが表示されない。

例えば1080*1920のようにモニタを縦置きしていると、ページの右側が切れてしまう。

その場合はブラウザ側で縮小するなどの対応が必要だ。

iOS・Android(モバイルアプリ)

App StoreやGoogle Play ストアで配信されている専用アプリからも生成が可能。

スマートフォンやタブレットの場合、こちらの方が使い勝手が良いだろう。

どんな種類の曲が作れるのか?

  • J-POP
  • 邦楽
  • ロック
  • メタル
  • エレクトロ
  • クラシック
  • ヒップホップ
  • ラップ
  • 民族音楽

など非常に多岐にわたる。

長さも1分前後の短いものから、最長8分まで作成可能だ。

プロンプトで直接長さを指定したり、もしくは歌詞の長さで決まる。

1秒単位のピッタリとした長さで作ることは出来ない。

歌詞がないインストロメンタルだと、2~3分程度の曲が生成されやすい気がする。

費用

Sunoのプラン一覧

2025-11-13時点で確認した内容なので、最新の価格や機能、権利などは公式サイトで確認して欲しい。

無料プロプレミアム
一ヶ月の利用料金0円1,500円4,500円
クレジット50クレジット/10曲分2,500クレジット/500曲分10,000クレジット/2,000曲分
モデルv4.5-all(無料用モデル)v5(最新)v5(最新)
商用利用不可(個人利用のみ)可(新規作成曲のみ)可(新規作成曲のみ)

無料で試してみて、良かったらプロへ移行するのが良さそう。

僕はプロプランで試してみた。

「Google アンケート モニター」で貯まってたGoogle Play クレジットを充てたので、数百円程度で済んだ。

作例

以下に作例を示す。

おなじ阿呆なら踊らにゃそんそん | オリジナルJpop(歌詞付き)
Follow Your Own Star | Original Anime Song (Jpop style, with lyrics) – YouTube
Lord of the B XVI | RPG最終ボス曲 | Final Boss Battle Theme (Retro RPG / SNES style) – YouTube
クラシック・ジャズ風味アンビエントによる作業用BGM | Background Music for Work & Study | Ambient Classical with Subtle Jazz – YouTube
夢の入口 – 1時間の快眠アンビエント – 睡眠導入音楽(作業用BGM) | The Gateway to Dreams – 1 Hour Sleep Ritual Ambient Music – YouTube

基本的な作り方

Webページはログイン後、左メニューのCreateから作成する。

アプリ版は、画面下部にある中央の大きな音符ボタンから移動する。

上部からSimpleとCustomの2種類が選べる。

Simpleモード

Simpleモードは、初心者・お試し向けといった内容で、曲の説明(Song Description)に200文字程度で記述する。

ちなみに入力する場合、プロンプトは英語で入力するのが基本だ。

日本語にも対応しているが、信頼性があまり高くない。

例を書く。

Energetic J-Pop anime opening with emotional female vocals, fast tempo, electric guitars, bright synths, and a feeling of youth, courage, and friendship.

日本語訳は以下の通り。

「エネルギッシュなJ-POP系アニメのオープニング。感情的な女性ボーカル、速めのテンポ、エレキギターと明るいシンセが響き、青春・勇気・友情を感じさせる曲」

注意として実在のアーティスト名などを入れると、警告メッセージが出て生成されない。

もしその歌手の影響を受けた曲を作りたいなら、直接名前を指定するのではなく、特徴を書くように心掛けよう。

歌詞は自動生成され、ユーザーが自分で歌詞を入力する欄はない。

またインストロメンタル(Instrumental)にチェックを入れると、文字通り歌のない楽器だけで演奏された曲が生成される。

このSimpleモードは設定などが非常に簡単で初心者向けであり、とりあえずお試しで1曲作ってみたい時にどうぞ。

ただし、細かいコントロール(歌詞構造・セクション指定・スタイル詳細など)はないため、必然的にSimpleモードは使わなくなる。

Customモード

本格的に曲を作りたいなら、Customモードを使っていく。

歌詞(Lyrics)スタイル(Style)曲名(Title)をそれぞれ設定する。

また拡張機能(Advanced Option)から、ボーカルの性別(Vocal Gender)歌詞のオート化(Lyrics Mode)奇妙さ(Weirdness)スタイルの影響度(Style Influence)を設定する。

Customモードの詳細

歌詞(Lyrics)

言語

日本語や英語に対応している。

他の言語については、中国語やロシア語、韓国語・ヘブライ語にも対応しているという。

日本語についてだが漢字も読めるが、たまに読み間違いをする場合もある。

よく間違える場合は、平仮名や片仮名で書くと良いだろう。

例えば、

君に萌(も)え萌(も)えバッキュンキュン

のように、括弧書きで読み仮名をふるって対応することも考えられるが、漢字と読み仮名で2回くり返し読むこともたまに起こったので、あまりオススメしない。

メタタグ

歌詞を書くほか、メタタグの記入も行える。

  • 曲の構成部分を定義する
  • ボーカルの種類や声の演出を指定する
  • 特定の楽器や音楽スタイルを強調する
  • 観客の反応や環境音・効果音を追加する

といった細かい定義や指定が可能だ。

ただ正式な書き方をまとめたSunoによる公式リファレンスは存在しない模様?

# Introのように書いても反応してくれるが、[]で書くのが一般的で無難。

以下に書き方の例を示すが、絶対この書き方じゃないとダメというものでもない。

余裕があれば、色々試してみて欲しい。

構成メタタグ意味
[Intro]イントロ/前奏
[Verse]Aメロ
[Pre-Chorus]Bメロ
[Chorus]サビ/コーラス
[Verse2]Aメロ2
[Bridge]間奏/Cメロ/ブリッジ
[Final Chorus]ラストサビ/大サビ/ファイナルコーラス
[Outro]後奏/アウトロ
構成メタタグの例

サビなら分かるけど、AメロとかBメロって何さ?

しゃーないなぁ

別のページでウチが詳しく説明したるわ

音楽生成AI「Suno」を使う上で知っておきたい構成について – LV73.net
ボーカル・声質メタタグ意味
[Male singer]男性
[Female singer]女性
[Child voice]子供
[Whispers]ささやき声
[Echoing vocals]エコー付き
[Harmonized chorus]ハーモニー
[Announcer]ナレーション
[Reporter]リポーター
[Giggling]笑い声
ボーカル・声質メタタグ

ここでボーカルの性別を設定する場合、男女デュエットの曲を作る場合だと想定される。

曲全体でどちらかの性別だと決まっている場合、Vocal Genderで設定するべきだ。

逆に男女デュエットの場合、Vocal Genderの指定は解除しておこう。

雰囲気メタタグ意味説明
[Mood: Uplifting]前向き・元気づける明るく勇気づける雰囲気
[Mood: Melancholic]物悲しい切なさ・哀愁のあるバラード向き
[Mood: Dreamy]夢のような幻想的・浮遊感のある雰囲気
[Mood: Dark]暗く重い不安・緊張・シリアスな印象
[Mood: Joyful]喜びに満ちたポップで明るく楽しい感じ
[Mood: Emotional]感情的・熱い感情を前面に出す(サビで盛り上げる系)
[Mood: Calm]穏やか・静かリラックスした日常系やED曲に合う
[Mood: Epic]壮大・勇壮オーケストラ・バトル・ファンタジー向き
雰囲気メタタグ
勢いメタタグ意味説明
[Energy: Low]静か・控えめゆったりとしたテンポ、バラードやローファイ向き
[Energy: Medium]適度な勢いポップスやJ-Popの標準的テンポ感
[Energy: High]高揚・激しいロック、EDM、アニメOPなどの盛り上がる曲向き
[Energy: Medium→High]徐々に盛り上がるサビに向かってテンションを上げる構成
勢いメタタグ
楽器・スタイルメタタグ意味
[Acoustic guitar]アコースティックギター
[Orchestral strings]オーケストラ弦
[Synth pads]シンセパッド
[Lo-fi]ローファイ
[Blues]ブルース
[Electropop]エレクトロポップ
[Jazz saxophone solo]ジャズサックスソロ
[Distorted electric guitar]ディストーションギター
楽器・スタイルメタタグ
効果音メタタグ意味
[Applause]拍手
[Cheers and applause]歓声
[Audience laughing]笑い声
[Birds chirping]鳥のさえずり
[Phone ringing]電話の着信音
[Bell dings]ベル
[Silence]無音
[Static]ノイズ音
[Censored]検閲音
効果音メタタグ

メタタグの注意事項

タグは「補助情報」であり、命令文ではない。

Suno のタグ(例:[Intro], [Female singer], [Drop] など)は、AIにヒントを与える補助信号として機能する。

つまり、「絶対にこうしろ」という指令ではなく、「こういう雰囲気で作ってほしい」という参考情報である。

多すぎるタグを入れると、AIがどれを優先すべきか判断できず、焦点のぼけた中途半端な結果になることがある。

また各タグはスタイル・声質・構成などを独立して指定するため、

例:[Female singer][Male singer][Rap verse][Whispers][Opera style]

のように多重指定すると、AIが複数の文脈を同時に処理しようとして曲調が不安定になる。

一つのセクションに主要タグは2〜3個までに絞るのが良い。

(例:「構成タグ+音楽スタイル+ボーカルタイプ」)

ただし出来る限り、最小限のタグにした方が曲が安定して生成されやすい

スタイル(Style)

Redditで紹介されていたのだが、以下のようなテンプレートを用いると良い。

Suno Style Prompt Guide 2.0 : r/SunoAI

Genre: "<サブジャンルを含むジャンル>"  
Exclude: "<除外したいジャンルや特徴>"  
Instruments: "<使用したい楽器、声質、サウンド特徴>"  
Tags: "<BPM; mood; drop type; extras>"  

以下は例。

Genre: "J-Pop, Anime Opening"
Exclude: "Metal, Jazz, Acoustic, EDM"
Instruments: "energetic female vocals; electric guitar riffs; driving drums; bright strings; catchy synth melodies"
Tags: "150 BPM; emotional; heroic; cinematic; youthful energy"
項目内容解説
Genre(ジャンル)「J-POP、アニメのオープニング」日本のポップス、特にアニメの主題歌スタイルを指定。明るくテンポの速い曲を想定。
Exclude(除外ジャンル)「メタル、ジャズ、アコースティック、EDM」激しいメタルや即興性の強いジャズ、生音中心のアコースティック、電子音主体のEDMを除外。純粋な「アニソン王道」のサウンドに集中させる意図。
Instruments(使用楽器)「エネルギッシュな女性ボーカル、エレキギターのリフ、勢いのあるドラム、明るいストリングス、耳に残るシンセメロディ」アニメOP定番の構成。女性ボーカル+ギター+シンセの組み合わせで明るく力強い印象を演出。
Tags(補助特徴)「テンポ150 BPM、感情的、ヒロイック、シネマティック、若々しいエネルギー」アニソンの特徴をまとめたムード指定。テンポ速めで疾走感、勇気や青春感を含んだ雰囲気をAIに伝える。
日本語訳と意味

面倒くさい人は、ChatGPTやGeminiのような文章生成AIに依頼すると良い。

先ほどのテンプレートと、自分の作りたい曲の要望を合わせて伝えれば、うまくまとめてくれたり、新しい提案をしてくれるだろう。

そして出来た曲を聴いて、さらに変更点や改善点を上手く言語化して、ブラッシュアップしていけばOK。

歌詞のオート化(Lyrics Mode)

こちらをAutoにすることで、歌詞を自動生成してくれる(Customモードを使う上であまり使う必要はないと思うが)。

奇妙さ(Weirdness)

「Weirdness」は、Suno AI の生成設定において どれだけ「通常のジャンル・構成から逸脱するか」を制御するパラメーターである。

言い換えれば、「どれほど実験的・予想外・非定型なサウンドにするか」を調整するスライダーであり、0 %〜100 %の範囲で設定可能だ。

値が低いと「定型的・安定的・ジャンル基準に忠実」な生成になり、値が高くなると「構造を大胆に変える・音の破綻を許容する・予想外の展開を入れる」ような生成になる。

  • 0 %~20 %:安定・定型重視
    • ジャンルの典型的構造を忠実に再現したい時に使用
  • 30 %~60 %:少しだけ外側へ冒険
    • ジャンルの枠は維持しつつも、「少し変化を加えたい」「少しだけ意外性を出したい」場合
  • 70 %~100 %:かなりの逸脱・実験レベル
    • 伝統的な構造をかなり外し、リズム・テンポ・歌声に変化を加えたり、サウンドを「奇妙」に演出したい時

高めの設定(例70%)だと、リズムが変則的になったり、歌声が変質したり、予想外の音響変化が入ることがある。

逆に低い設定だと、「聴き慣れた」ジャンル感・構成感が強く出るため、ジャンルらしさ・キャッチーさを維持したい場合に使う。

Weirdnessを上げすぎると、歌詞が聞き取りづらくなったり、曲の長さが短くなったり(または途中で崩壊気味になる)という報告もある。

よく分からない人は、作るジャンルに合わせて値を設定するのが無難だろう。

ジャンルWeirdnessの目安傾向
ポップス・アニソン0〜30%安定・キャッチー
ロック・メタル20〜50%個性・荒々しさ
EDM・トランス40〜70%展開・高揚感
バラード・アコースティック0〜20%自然・感情重視
デスメタル・ホラー70〜100%破壊的・異形的
アンビエント・映画音楽60〜100%芸術的・浮遊感
ジャンルごとのWeirdnessの目安

Suno的には15~85%を推称しているようで、それ以外の値は赤く表示されるようになっている。

参考までに、僕は今までにない曲を作りたいと思っているので、アニソンでも40%付近で作っていたりする。

スタイルの影響度(Style Influence)

Style Influence は、「プロンプト(ジャンル・楽器・ムード等)で指定したスタイルにどれだけ忠実に生成するか」を調整するスライダーである。

値を高めに設定すると、プロンプトで指定したスタイル(ジャンル・楽器・雰囲気)が強く反映される。

値を低めに設定すると、生成が「指定したスタイルから少し逸脱・自由度が高い」ものになる。

スタイルを決める(ジャンル、雰囲気、楽器構成など)をプロンプト内で明示する。

Style Influence スライダーを見つけて、「0~100%」の範囲で設定。

値をどれくらいにするかを、生成目的・ジャンル・自由度に応じて決める。

  • 70〜90%:スタイルをかなり忠実に再現したい場合
  • 30〜50%:スタイルはある程度反映しつつ“少し変化”を加えたい場合
  • 0〜20%:スタイルよりも実験的・自由な生成を重視したい場合

スタイルをしっかり指定しているプロンプトほど、Style Influence を高く設定すると「想定どおり」のサウンドが出やすい。

ただし、Style Influence を 高く、Weirdness(奇妙さ)も高く設定すると、逆に「スタイルに対する過剰な解釈」や「意図しない逸脱」が起こる可能性ある。

なので、「スタイル忠実」な安定した曲を作りたいなら、Style Influence を80%前後に設定し、Weirdness を低めに保つという組み合わせがお推奨される。

次回予定

CoverやExtendについて触れていく。

guest

0 Comments
最も古い
最新 高評価
インラインフィードバック
すべてのコメントを見る