「画面キャプチャを撮って、パワポに貼り付けて、説明文を書く…」そんな面倒なマニュアル作成に、膨大な時間を取られていませんか?
私は最近、話題のClaude「Agent Skills」を活用して、操作動画からスクリーンショット付きのPowerPoint資料を自動生成するツールを作成しました。AIが動画内の「画面が切り替わった瞬間」を自動で判別し、文字起こしデータと組み合わせて、実用的なマニュアルを数分で出力します。
この記事では、実際に作成したAgent Skillの仕組みから、プログラミング知識がなくてもClaudeとの対話だけで自分専用のスキルを構築する手順まで、詳しく解説します。業務効率を劇的に向上させたい方は、ぜひ最後までご覧ください。
目次

Agent Skillsは、Anthropicが2025年10月に発表した革新的な機能です。従来の一回限りのプロンプトとは異なり、再利用可能なファイルシステムベースのリソースとして、Claudeに専門的な知識とワークフローを提供します。
✅ 主な特徴
💡 従来のプロンプトとの違い
従来のプロンプトは会話レベルでの一回限りの指示でしたが、Agent Skillsは複数の会話にわたって同じガイダンスを繰り返し提供する必要がありません。まるで新しいチームメンバーに渡すオンボーディングガイドのように、体系化された知識を蓄積できます。

私が作成した「動画からパワポマニュアル」Agent Skillは、以下の技術的な仕組みで動作します。
1. 音声処理(文字起こし)
ローカルの動画ファイルをWhisperに送信し、高精度な文字起こしを実行します。ElevenLabsのMCP(Model Context Protocol)を設定することで、Claudeが外部サービスと連携できるようになります。
⚠️ 注意点:ElevenLabsのMCPが設定されていない場合、音声処理はスキップされ、画像のみでマニュアルが生成されます。
2. 動画分割と画像抽出
動画ファイルを1秒ごとに分割し、各フレームを画像として抽出します。ここで重要なのは、画面の変化が大きい部分のみを残すアルゴリズムです。
💡 なぜ画面変化を検出するのか?
マニュアルにおいて重要なのは、操作の「切り替わり」の瞬間です。同じ画面が続いている部分は説明に不要なため、変化点のみを抽出することで、効率的で分かりやすいマニュアルが作成できます。
3. 文字起こしと画像の統合
抽出された画像と文字起こしデータを組み合わせ、各ステップに対応する説明文を生成します。画像の内容を解析して、文字起こしだけでは不足する視覚的な情報を補完します。
4. PowerPointファイルの高速生成
テンプレートファイルの文字と画像を書き換える方式を採用することで、1枚1枚スライドを作成するよりも大幅に処理時間を短縮しています。
| 項目 | 仕様・制約 |
| 対応動画時間 | 最大5分程度 |
| 必要な前提条件 | ローカルに動画ファイルが存在すること |
| 文字起こし精度 | ElevenLabs API使用時:高精度 |
| 生成時間 | 30秒の動画で数分程度 |
| 出力形式 | PowerPoint(.pptx) |

実際に30秒程度のエージェントスキル設定方法を説明した動画を使用して、マニュアルを生成してみました。

画面キャプチャの精度
説明文の品質
⚠️ 改善が必要な点
💡 実用性の評価
生成されたマニュアルは「粗いけれども実用的」なレベルに達しており、最終的に不要な部分をカットして使用することで、従来の手動作成と比較して大幅な時間短縮が実現できます。

Agent Skillの作成は、想像以上に簡単です。プログラミング知識がなくても、Claudeとの対話だけで高機能なスキルを構築できます。
ステップ1:要件の整理と依頼
私が実際に使用した依頼文は以下の通りです:
Agent skillsで、動画データからスクショつきマニュアル資料にしたい。
・動画データを文字起こしして内容を考える
→mcp-server-whisper で
・動画データを画像にし、最適な画像を選ぶ
→プログラムで1秒ごとに分割する
→全画像は使えないと思うタイムラインをうまく使って使う画像を選定
・上記を組み合わせてPowerpointのマニュアル資料にする
→pptx-creator-workstyleevolution を使う
→ただし、なるべく生成速度を早めたいので、シンプルな出力にできるとよい(毎回作るのではなく、文字と画像だけ差し替えするとか?)
ステップ2:技術的な詳細の調整
ステップ3:Claudeによる自動ファイル生成
驚くべきことに、Claudeは対話を通じて以下を自動生成します:
💡 Claudeの賢さに驚いた点
Claudeは単にファイルを作成するだけでなく、「ビデオマニュアル」という一つの塊のファイルセットとして、アセットや必要なガイド、作り方まで全てをまとめて作成してくれました。これにより、そのままスキルとして使用したり、ダウンロードして配布することが可能になります。

初回作成後も、以下のような要望を追加して継続的に改善できます:
Claudeは要望に応じてスキルをアップデートし、新しいバージョンを生成してくれます。

ローカルファイルが必須
このAgent Skillを使用する際の最も重要な制約は、動画ファイルがローカル(手元のパソコン)に存在する必要があることです。
💡 なぜローカルファイルが必要なのか?
動画ファイルをチャット上にアップロードすると、そのファイルはサーバー上に送られてしまいます。MCPは手元のパソコン上のファイルにアクセスする仕組みのため、サーバー上のファイルは処理できません。
具体的には、「C:\Users\[ユーザー名]\Videos\sample.mp4」のように、ローカルパスを指定する必要があります。
| 項目 | 要件 |
| Claudeアプリ | デスクトップアプリ版(推奨) |
| ElevenLabs MCP | 音声処理を使用する場合は必須 |
| 動画ファイル | ローカルストレージに配置 |
| PowerPointテンプレート | カスタマイズする場合は事前準備 |
生成されるマニュアルは、デフォルトでは私の会社のテンプレートが使用されています。自社用にカスタマイズする場合は:
これらの変更により、自社ブランドに合ったマニュアルを自動生成できるようになります。

Agent Skillsは「若干ハードルが高い」「難しい」という印象を持たれがちですが、実際に作成してみると、その印象は大きく変わります。
実際の作成体験
1. 明確な要件定義
「何を自動化したいのか」「どのような成果物が欲しいのか」を具体的に伝えることが重要です。
2. 段階的な改善
最初から完璧を求めず、基本機能を作成してから段階的に機能を追加していく方が効率的です。
3. Claudeとの対話を活用
技術的な詳細が分からなくても、Claudeが適切な実装方法を提案してくれます。遠慮なく質問や要望を伝えましょう。

私がこのAgent Skillを作成した背景には、従来のマニュアル作成プロセスの深刻な課題がありました。
時間的コスト
品質の一貫性
劇的な時間短縮
従来は1つのマニュアル作成に数時間を要していましたが、Agent Skillを使用することで:
合計で30分程度まで短縮できました。
品質の標準化

Agent Skillsは単なる機能追加ではなく、AIエージェントの根本的な進化を示しています。
自己改善するAIへの道筋
Anthropicは将来的に、Claudeが自分自身でスキルを作成・編集・評価できるようになることを目指しています。これが実現すれば:
研修・教育分野
業務プロセス改善
より高度な動画解析
多様な出力形式への対応

Claude Agent Skillsを活用した動画からパワポマニュアルの自動生成は、単なる時間短縮ツールを超えた価値を提供します。
この記事を読んで興味を持たれた方は、以下のステップで実際に試してみることをお勧めします:
Agent Skillsは、AIと人間の協働における新しい可能性を示しています。単純な作業の自動化から始まり、最終的には組織の知識を体系化し、継続的に改善していく「学習する組織」の実現につながるでしょう。
ぜひこの機会に、Agent Skillsの可能性を実際に体験してみてください。
本記事の内容は、以下の資料も参考にしています:
Claude Agent Skillsは、Anthropicが提供する再利用可能なファイルシステムベースのリソースです。Claudeに専門的な知識とワークフローを提供し、従来のプロンプトのように毎回指示する必要なく、体系化された知識を蓄積・活用できます。指示書や実行可能コードなどをまとめて管理し、必要な時に必要な情報のみを読み込むことで、効率的なAI活用を可能にします。
動画からPowerPointマニュアルを自動生成するには、まずClaudeのデスクトップアプリが必要です。音声処理を行う場合はElevenLabs APIの設定も必須です。また、元となる動画ファイルはローカルストレージに保存されている必要があります。必要に応じて、PowerPointのテンプレートを自社用にカスタマイズすることも可能です。
動画の長さにもよりますが、30秒程度の動画であれば数分程度でPowerPointマニュアルが生成されます。テンプレートファイルの文字と画像を書き換える方式を採用しているため、手動で1枚ずつスライドを作成するよりも大幅に時間を短縮できます。
いいえ、動画ファイルをClaudeにアップロードする必要はありません。Agent Skillsはローカルにある動画ファイルを参照して処理を行うため、動画ファイルは手元のパソコンに保存されている必要があります。ローカルパスを指定してAgent Skillsを実行してください。
はい、可能です。PowerPointテンプレートファイルを自社のロゴやデザイン、色調、フォントなどに合わせてカスタマイズすることで、自社ブランドに合ったマニュアルを自動生成できます。テンプレートを差し替えてAgent Skillsを実行するだけで、簡単に変更できます。
Workstyle Evolution代表。18万人超YouTuber&『ChatGPT最強の仕事術』著者。
株式会社Workstyle Evolution代表取締役。YouTubeチャンネル「いけともch(チャンネル)」では、 AIエージェント時代の必須ノウハウ・スキルや、最新AIツールの活用法を独自のビジネス視点から解説し、 チャンネル登録数は18万人超(2025年7月時点)。