NTT「tsuzumi 2」発表:30Bパラメータで1GPU動作、RAG・業界特化に強み。東京通信大学が学内LLM採用決定 - 生成AIビジネス活用研究所

NTT「tsuzumi 2」発表:30Bパラメータで1GPU動作、RAG・業界特化に強み。東京通信大学が学内LLM採用決定

NTT「tsuzumi 2」発表:30Bパラメータで1GPU動作、RAG・業界特化に強み。東京通信大学が学内LLM採用決定

NTTが2025年10月20日に発表した大規模言語モデル「tsuzumi 2」が、日本の企業DXに新たな可能性をもたらしています。

初代tsuzumiから大幅に進化したこのモデルは、300億パラメータで1GPU環境で動作し、同規模モデル中で世界トップクラスの日本語性能を実現。早速、東京通信大学が学内LLM基盤として導入を決定するなど、実用化が本格的に始まっています。

従来のLLMが抱える電力消費、運用コスト、セキュリティの課題を解決しつつ、RAG(検索拡張生成)や業界特化モデルの開発効率を大幅に向上させたtsuzumi 2。その技術的特徴と実用性について、詳しく解説していきます。

tsuzumi 2の核心技術:軽量設計で実現した高性能

tsuzumi 2の最大の特徴は、30億パラメータという軽量設計でありながら、大規模モデルに匹敵する性能を実現している点です。比較対象となるGPT-OSS(20億パラメータ)、Gemma-3(27億パラメータ)、Qwen-2.5(32億パラメータ)といった同サイズ群のモデルと比較して、知識、解析、指示遂行、安全性の4つの基本的なベンチマークで優れた結果を示しています。

場合によってはLlama(120億パラメータ)やGPT-OSS(120億パラメータ)といった4倍規模のモデルよりも優れた性能を発揮することです。これは、NTTが40年以上にわたって蓄積してきた自然言語処理技術の研究成果が結実した結果と言えるでしょう。

1GPU(40GB以下メモリ搭載)で動作可能という軽量性は、従来の大規模モデルが複数GPUや数百GBメモリを必要とする中で、圧倒的な優位性を持っています。この設計により、オンプレミス環境やプライベートクラウドでの低コスト運用が可能となり、機密情報を外部に出すことなく安全にAIを活用できます。

RAGと業界特化モデルの開発効率が大幅向上

tsuzumi 2の実用面での最大の強みは、RAG(検索拡張生成)とファインチューニングによる企業・業界特化モデルの開発効率向上です。RAGにおいては先進モデルと並んで高いスコアを記録し、企業内文書の分析や理解において優れた性能を発揮します。

特に注目すべきは、ファインチューニングに必要なデータ量を大幅に削減できることです。ファイナンシャルプランニング技能検定2級試験での検証では、Googleの同規模モデルGemma-2 27Bが合格基準(正解率60%以上)に到達するために1,900問の追加学習を必要としたのに対し、tsuzumi 2はわずか200問の追加学習で正解率64%を達成し、さらにチューニング後には70%に到達しました。つまり、約10分の1のデータ量で同等以上の性能を実現しています。

これは、tsuzumi 2が日本特有の金融データなどを使って事前学習されているため、追加学習なしでも54%の正答率を示せることが要因です。金融・医療・公共分野の知識を事前に強化しており、これらの分野での特化型モデル開発が大幅に効率化されています。

圧倒的な低コスト運用を実現

tsuzumi 2の競争優位性の一つが、運用コストの低さです。30億パラメータでありながら1GPU(A100 40GB相当)で動作するため、推論時のハードウェアコストは約500万円に抑えられます。

これに対し、Llama-4(400億パラメータ)ではNVIDIA H100 80GB相当を8基必要とし、ハードウェアコストは約5,000万円、DeepSeek-v3.1(700億パラメータ)では16基必要で約1億円のコストがかかります。つまり、tsuzumi 2は大規模モデルと比較して推論コストを10分の1から20分の1に削減できる計算になります。

料金体系については、Microsoft Azure AI Foundryで提供されており、入力が1000トークンあたり0.004ドル(100万トークンあたり0.4ドル)、出力が1.1ドルとなっています。GPT-4o miniと比較すると若干高めですが、GPT-5 miniより安い水準で、まずまずの価格設定と言えるでしょう。

また、Azure経由以外でも独自のモデルを使って、お金を払えば自社環境に持ってくることができ、オンプレミス、プライベートクラウド、パブリッククラウドの3つの環境で利用可能です。

東京通信大学での実用化が決定

tsuzumi 2の実用性を示す具体例として、東京通信大学が学内LLM基盤として導入を決定したことが挙げられます。国産LLMを基盤に学内LLM基盤を整備していく方針で、学内データを外部クラウドに出さずにLLMを運用し、授業Q&Aの自動化、教材作成支援、進路相談のパーソナライズなどに活用する予定です。

この導入決定は、tsuzumi 2が実際の教育現場で求められる性能と安全性を満たしていることを示しています。特に、機密性の高い学内情報を外部に出すことなく処理できる点が、教育機関にとって重要な選択要因となったと考えられます。

また、富士フイルムビジネスイノベーションとNTTドコモビジネスが、tsuzumi 2と富士フイルムのAI技術「REiLI」を組み合わせた新たな生成AIソリューションの提供に向けた検討を開始するなど、企業レベルでの活用も本格化しています。

業界からの高い関心と相談件数の増加

tsuzumiに対する市場の関心は非常に高く、相談件数はどんどん増えており、いろんな業界から相談が来ている状況です。特に保険業界、コンタクトセンター、金融分野からの問い合わせが多く、670億円の受注実績(2025年第1四半期)を記録しています。

活用したい業務として最も多いのは、マニュアルや社内資料の文書検索・要約生成です。これはRAG(検索拡張生成)を活用した社内データ活用がベースとなっており、企業内文書の分析や理解において、tsuzumi 2の長文読解レベルの高さが評価されています。

特化性能に強みがあり、チューニングを少ないデータでもレベルが高いという特徴は、ベースモデルが強いことを意味しており、企業が求める業界特化型AIの開発において大きなアドバンテージとなっています。

ソブリンAIとしての戦略的意義

tsuzumi 2は、ソブリンAI(主権AI)としての戦略的意義も持っています。ナショナルインテリジェンス、安全保障や産業競争力に対しては国産AIが重要であり、質の高い日本語データと著作権に配慮したデータセットを活用して開発されています。

image

データ・システム・運用の観点で自国・自社コントロールが可能であり、海外製LLMが抱える電力負荷・コスト・情報保護といった課題を克服しつつ、企業や自治体が安全に運用できる設計となっています。機密性の高い情報を外部に出すことなく安全に処理できるため、金融・医療・公共といった規制の厳しい業界での活用が期待されています。

まとめ

NTTのtsuzumi 2は、以下の点で従来のLLMとは一線を画す特徴を持っています:

  • 軽量設計と高性能の両立:30億パラメータで1GPU動作を実現しながら、大規模モデルに匹敵する性能
  • 日本語処理能力の優位性:同規模帯で世界最高クラスの日本語性能を実現
  • RAG・ファインチューニング効率:企業・業界特化モデルの開発効率を大幅向上
  • 高セキュリティ:オンプレミス・プライベートクラウドでの安全な運用が可能
  • ソブリンAIとしての価値:国産技術による自国・自社コントロールの実現

tsuzumi 2は、日本企業が求める「高性能・高セキュリティ・低コスト」を同時に実現した純国産LLMとして、企業DXの新たな選択肢を提供しています。特に、機密情報を扱う業界や、日本語処理能力を重視する用途において、その真価を発揮することが期待されます。

📺 この記事の元となった動画です

よくある質問(FAQ)

Q1 NTTのtsuzumi 2とは何ですか?

NTTが開発した大規模言語モデル(LLM)で、30億パラメータという軽量設計ながら、高い日本語処理能力とRAG・業界特化モデルの開発効率の良さが特徴です。1GPUで動作するため、低コストでの運用が可能です。

Q2 tsuzumi 2はどのような環境で利用できますか?

オンプレミス、プライベートクラウド、パブリッククラウドの3つの環境で利用可能です。Microsoft Azure AI Foundryを通じて提供されており、Azure経由以外でも独自のモデルを自社環境に導入できます。

Q3 tsuzumi 2は他のLLMと比べて何が優れていますか?

同規模のLLMと比較して、日本語性能が高く、RAGの性能も優れています。また、特化モデルを開発する際のファインチューニングに必要なデータ量が少ないため、開発効率が良い点が強みです。さらに、1GPUで動作するため、運用コストを大幅に削減できます。

Q4 tsuzumi 2はどのような用途に適していますか?

企業内文書の検索・要約生成、金融・医療・公共分野など、機密情報を扱う業界での利用に適しています。また、日本語処理能力を重視する用途や、RAGを活用した社内データ活用にも有効です。東京通信大学では、授業Q&Aの自動化、教材作成支援、進路相談のパーソナライズなどに活用予定です。

Q5 tsuzumi 2の料金体系はどのようになっていますか?

Microsoft Azure AI Foundryで提供されており、入力が1000トークンあたり0.004ドル、出力が1000トークンあたり1.1ドルです。GPT-4o miniと比較すると若干高めですが、GPT-4よりは安価な水準です。


この記事の著者

池田朋弘のプロフィール写真

池田朋弘(監修)

Workstyle Evolution代表。18万人超YouTuber&『ChatGPT最強の仕事術』著者。

株式会社Workstyle Evolution代表取締役。YouTubeチャンネル「いけともch(チャンネル)」では、 AIエージェント時代の必須ノウハウ・スキルや、最新AIツールの活用法を独自のビジネス視点から解説し、 チャンネル登録数は18万人超(2025年7月時点)。

著書:ChatGPT最強の仕事術』(4万部突破)、 『Perplexity 最強のAI検索術』、 『Mapify 最強のAI理解術

合わせて読みたい
関連記事

公式LINEで最新ニュースをゲット

LINE登録の無料特典
LINE登録の無料特典
icon

最新のAIニュース
毎週お届け

icon

生成AIの業務別の
ビジネス活用シーン

がわかるAIチャット

icon

過去のAIニュースから
事実を確認できる
何でもAI相談チャット

icon

ニュース動画
アーカイブ

ページトップへ