ElevenLabsとは?
ElevenLabsは、テキストを入力するだけでリアルな音声を生成できるAI音声プラットフォームです。ナレーション、ポッドキャスト、AI動画など、さまざまなコンテンツ制作に広く使われており、特に音声クローニング技術の高さで知られています。
料金体系は一見複雑に見えますが、ポイントを押さえれば自分に合ったプランを選ぶのは難しくありません。このガイドでは、クレジットの実際の使い道から代替ツールとの比較まで、必要な情報をまとめてお伝えします。
目次
ElevenLabsのプランは、個人クリエイター向けとビジネス向けの2グループに分かれています。
| プラン | 月額料金 | 月間クレジット | 主な機能 | こんな人に最適 |
|---|---|---|---|---|
| Free(無料) | $0 | 1万 | 基本TTS・音声ツール | まず試してみたい人 |
| Starter | $5 | 3万 | 商用利用・インスタント音声クローン | 個人クリエイター入門 |
| Creator | $22(※初月50%オフキャンペーン実施中の場合あり) | 10万 | プロ品質の音声クローニング | YouTuber・ポッドキャスター |
| Pro | $99 | 50万 | 44.1kHz PCM出力・大量生成 | 制作会社・エージェンシー |
| Scale | $330 | 200万 | チームコラボレーション | 中規模企業 |
| Business | $1,320 | 1,100万 | 低遅延TTS・高度な音声機能 | 大規模組織 |
| Enterprise | 要お問い合わせ | カスタム | DPA/SLAsに関するカスタム条件と保証・カスタムSSO・HIPAA対応など | 大企業 |
出典:ElevenLabs公式料金ページ(最新情報は公式サイトをご確認ください)
ElevenLabsでは、音声ファイルの本数ではなくクレジットという単位で使用量が管理されます。クレジットは生成するテキストの文字数に応じて消費されます(標準モデルでは1文字=1クレジット)。
💡 目安:1,000クレジット ≒ 約1分の音声生成
※ このセクションの音声生成時間の目安は、すべて英語テキストの場合の参考値です。日本語などの言語では異なる場合があります。
※ 使用するモデルによって変動します。Flash/Turboモデルはセルフサーブプランでは0.5クレジット/文字、Enterpriseプランでは既存の割引条件によって0.5〜1クレジット/文字になる場合があります
| プラン | クレジット数 | 生成できる音声の目安 |
|---|---|---|
| Free | 1万 | 約10分 |
| Starter | 3万 | 約30分 |
| Creator | 10万 | 約1.6時間 |
| Pro | 50万 | 約8時間以上 |
| Scale | 200万 | 約33時間 |
| Business | 1,100万 | 約183時間20分 |
| Enterprise | 要お問い合わせ | — |
たとえば、YouTubeに月10本ほどの動画を投稿しているクリエイターなら、Creatorプランで十分まかなえるケースが多いです。毎日大量のナレーションを生成する制作会社や代理店なら、Pro以上が安心です。
「クレジット」って、なんで音声ファイルの本数じゃなくて文字数で管理されるんですか?なんか複雑そうで…
音声の長さはスクリプトの文字数でほぼ決まるからです。たとえば30秒のナレーションと30分のポッドキャストは同じ「1本」でも、文字数は全然違いますよね。クレジット=文字数で管理することで、使用量の見積もりが正確にできます。「1,000クレジット≒約1分」と覚えておくだけで、月にどのくらい使えるかがパッと計算できますよ。
まず「ElevenLabsを試してみたい」という方のためのプランです。テキスト読み上げ(TTS)の基本機能や音声デザインツールを無料で体験できます。
⚠️ ただし注意点があります:
商用利用が解禁される最初のプランです。月3万クレジットに加え、短い音声サンプルから合成音声を作れるインスタント音声クローニングも使えます。
✅ こんな方におすすめ:
⚠️ 長尺の動画やポッドキャストには物足りなさを感じるかもしれません。
個人クリエイターに最も人気のプランです。 月10万クレジットに加え、より高品質なプロフェッショナル音声クローニングが利用可能になります。192kbpsの高品質オーディオ出力にも対応し、長いスクリプトでも安定したクオリティが保たれます。
※ 新規登録者向けに初月50%オフのキャンペーンが実施されることがあります(時期によって異なるため、公式サイトをご確認ください)。
✅ こんな方におすすめ:
💡 コストとスペックのバランスが最も良いとされており、AI音声制作を本格的に始めるなら、まずここから検討するのがおすすめです。
月50万クレジットに加え、Creatorプランまでは利用できない44.1kHz PCMオーディオ出力(API経由)が解放されます。なお、APIはFreeプランを含む全プランから利用可能です。
✅ こんな方におすすめ:
これら3つのプランは、チームや組織での運用を前提とした設計です。
ElevenLabsが特に人気な理由のひとつが、この音声クローニング技術です。自分の声や特定の声を学習させ、オリジナル合成音声を作れます。クローニングには2種類あります。
| 方式 | 特徴 | 利用可能プラン |
|---|---|---|
| インスタント音声クローニング | 短いサンプル音声で即座に作成。手軽だが長い読み上げでは不安定になることも | Starter以上 |
| プロフェッショナル音声クローニング | より多くの学習音声を使い、高精度・高安定性。感情や抑揚のコントロールも可能 | Creator以上 |
💡 オーディオブックやビデオエッセイのように長尺コンテンツを作る場合は、プロフェッショナル音声クローニングが断然おすすめです。 長いスクリプトでも声のブレが少なく、一貫したクオリティを保てます。
音声クローニングって、どのくらいの音声サンプルを用意すれば自分の声を再現できるんですか?
インスタント音声クローニングなら、数十秒〜数分程度のサンプルでも作成できます。手軽な反面、長尺コンテンツでは途中で声がブレることもあります。一方、プロフェッショナル音声クローニングはより多くのサンプルを学習に使うため、長いコンテンツでも安定したクオリティを維持できます。YouTubeやポッドキャストを本格的にやるなら、Creatorプラン以上でプロフェッショナル版を使うのが現実的です。
ElevenLabsのクレジット消費量は、生成するテキストの文字数によって変わります。いくつかの実例で確認してみましょう。
TikTokやInstagram Reelsなど30〜60秒の動画向けナレーション:
10分程度のYouTube動画向けナレーション:
30分程度のポッドキャスト1エピソード:
書籍1冊分(約8〜10万文字)の音声化:
Freeプランで生成したコンテンツは商用利用不可です。さらに、無料プランまたは未ログイン状態でコンテンツを公開する場合は、タイトルに「elevenlabs.io」または「11.ai」を含めるアトリビューション(帰属表示)が義務付けられています。収益化済みのYouTubeやポッドキャストへの使用は認められません。
対策: 商用コンテンツを作り始めたら、最低でもStarterプランへアップグレードしましょう。
Starterプランのインスタント音声クローンは手軽ですが、長尺コンテンツでは声がブレることがあります。
対策: オーディオブックやポッドキャストなど長尺コンテンツを作る場合は、Creatorプラン以上でプロフェッショナル音声クローニングを使いましょう。
有料プランでは未使用クレジットを最大2ヶ月分まで繰り越せますが、ダウングレードやキャンセル時には失効します。
対策: プランを変更・解約する際は、残クレジットを使い切ってからにしましょう。
ユーザー数や生成量が増えてから請求額に驚くケースがあります。
事前に確認すること:
標準モデル(Multilingual v2)は1文字=1クレジットですが、Flash/Turboモデルはセルフサーブプランでは0.5クレジット/文字と効率的です(Enterpriseプランでは既存の割引条件によって0.5〜1クレジット/文字になる場合があります)。品質確認用の試聴や大量生成時には、Flash/Turboモデルを使うとクレジットを節約できます。
対策: 最終成果物はMultilingual v2、試聴・下書きにはFlash/Turboモデルと使い分けましょう。
とりあえず無料プランで試してから、後でアップグレードすればいいんじゃないですか?
機能を試す分には問題ありません。ただ、無料プランで生成した音声はYouTubeやポッドキャストなど収益化コンテンツへの使用がNGで、公開する場合はタイトルにElevenLabsのクレジット表記が必要です。「作ってみてSNSにすぐ上げよう」と思うと、思わぬルール違反になることも。月$5のStarterプランから商用ライセンスが解禁されるので、発信目的があるなら最初からStarterにした方がトラブルを防げます。
ElevenLabsは優れたツールですが、用途や予算によっては他のツールがより合っている場合もあります。
| ツール | 強み | 主な用途 | こんな人に最適 |
|---|---|---|---|
| ElevenLabs | 高品質な音声クローニング | ナレーション・オーディオブック | クリエイター・チーム |
| Magic Hour | AI動画コンテンツとの統合 | AI動画ナレーション・メディア制作 | 動画クリエイター |
| Descript | 音声合成+動画・音声編集 | ポッドキャスト・マルチメディア制作 | コンテンツ編集者 |
Magic Hourは、AI動画制作ワークフロー全体に音声生成を統合したツールです。音声生成だけでなく、AI動画コンテンツ制作のパイプライン全体をカバーしているため、自動化動画・SNSコンテンツ・AIストーリーテリングを作りたいチームに向いています。
特定の声を複製して使い回したい方向けに、Magic Hour Voice Clonerというクローニング専用ワークフローも用意されています。
Descriptは「音声合成+編集環境の一体化」というユニークなアプローチが特徴です。テキスト書き起こし・音声編集・動画編集をひとつのプラットフォームで完結できるため、ポッドキャスターや動画編集者に特に人気があります。
Q:ElevenLabsはいくらかかりますか?
A:無料プランから月$1,320のBusinessプランまで幅広く、大企業向けのEnterpriseは要相談です。
Q:無料プランはありますか?
A:はい。月1万クレジット(約10分の音声生成)を無料で利用できます。ただし商用利用は不可です。
Q:クリエイターにはどのプランがおすすめですか?
A:多くの個人クリエイターにCreatorプランが選ばれています。プロ品質の音声クローニングと月10万クレジットを、比較的リーズナブルな価格で使えるからです。
Q:月に生成できる音声の量は?
A:プランによって異なります。たとえばCreatorプランの10万クレジットは、約1.6時間分のナレーション生成に相当します。
Q:ElevenLabsよりコスパの良い代替ツールはありますか?
A:Magic Hour、Descriptなど、予算や用途に応じたツールがあります。それぞれ得意分野が異なるので、自分のワークフローに合ったものを選びましょう。
ElevenLabsは、個人クリエイターから大規模な企業まで、幅広いニーズに対応できるAI音声プラットフォームです。
Magic Hour共同創業者兼CEO。Y Combinator採択歴を持つ起業家。
AI動画生成プラットフォーム「Magic Hour」の共同創業者兼CEO。Y CombinatorのWinter 2024バッチに採択された実績を持つ起業家である。Meta(旧Facebook)ではデータサイエンティストとして、新規プロダクト開発部門「New Product Experimentation(NPE)」にて0→1のコンシューマー向けソーシャルプロダクトの開発に従事した経験を有する。
この記事は著者の許可を得て公開しています。
元記事:ElevenLabs Pricing (2026): Plans, Voice Cloning Costs, and Alternatives
Workstyle Evolution代表。18万人超YouTuber&著書『ChatGPT最強の仕事術』は4万部突破。
株式会社Workstyle Evolution代表取締役。YouTubeチャンネル「いけともch(チャンネル)」では、 AIエージェント時代の必須ノウハウ・スキルや、最新AIツールの活用法を独自のビジネス視点から解説し、 チャンネル登録数は18万人超(2025年7月時点)。