
2025/08/18(月)
NECが2025年8月27日に発表した「cotomi Act(コトミ アクト)」は、AI業界に衝撃を与える画期的な技術です。国際的ベンチマーク「WebArena」において、世界で初めて人間のタスク成功率78.2%を上回る80.4%を達成し、従来のAIエージェントが40%~70%前後にとどまっていた中で、人間を超える性能を実現しました。
この技術の最大の革新は、従来のAIでは扱いが困難だった「暗黙知」を自動的にデータ化し、ブラウザ操作を高精度で自動化できる点にあります。ベテラン社員が長年の経験で培った直感やノウハウを、AIが理解・活用できる形に変換することで、複雑な業務プロセスの自動化を実現しています。
目次
cotomi Actは、ブラウザ上の操作履歴やログといった行動履歴から、専門業務に内在する暗黙知を自動抽出し、形式知化するAIエージェント技術です。この技術により、これまでAIでは活用が困難だった人間の経験や直感に基づく知識を、業務自動化に活用できるようになりました。
従来のRPA(Robotic Process Automation)では、ユーザーが操作した内容をそのまま記録・再現するだけでした。しかし、cotomi Actは操作内容を単純に記録するのではなく、その操作の意味や背景を理解し、抽象化して同じような操作ができる形に発展させることで、精度を大幅に向上させています。
具体的には、ベテラン社員のブラウザ操作から業務の知見や情報をまとめ上げ、その理解した結果をもとに、ChatGPTエージェントやその他の高レベルなAIシステムと連携して、ブラウザを自動操作することができます。
cotomi Actの技術的優位性を証明したのが、国際的ベンチマーク「WebArena」での成果です。WebArenaは、AIモデルが実際のウェブサイト上でタスクを実行する能力を測定する重要な評価プラットフォームで、6つのサイトに関する計812のタスクから構成されています。
特に注目すべきは、公式に人間での評価を実施した179のタスクにおいて、cotomi Actが80.4%のタスク成功率を記録したことです。これは人間の78.2%を上回る世界初の成果であり、AIエージェントがWebブラウザ操作において人間を超える性能を実現したことを示す歴史的な指標となりました。
この成果は、2025年7月17日に発表されたOpenAIのChatGPT agentが達成した65.4%のスコアをも大きく上回るものです。従来のAIエージェントが40%~70%前後の成功率にとどまっていたことを考慮すると、cotomi Actの80.4%という数値は業界に大きな衝撃を与える結果といえます。
cotomi Actの核心技術は、暗黙知の自動抽出・形式知化機能にあります。この技術がどのように動作するかを詳しく解説します。
cotomi Actは、ブラウザでの様々な操作を観察し、その操作パターンから業務の知見や情報を理解します。単純に「どのボタンをクリックしたか」「どのフィールドに何を入力したか」という表面的な操作だけでなく、なぜその操作を行ったのか、どのような判断基準で次のアクションを決定したのかといった、操作の背景にある思考プロセスまで抽出します。
例えば、ベテラン社員が特定の条件下で異なる操作手順を選択する場合、その判断ポイントや条件分岐の根拠を自動的に学習し、同様の状況で適切な判断ができるよう知識として蓄積します。
抽出された暗黙知は、NEC独自の生成AI「cotomi」などの技術で自動分析され、抽象化されます。これにより、特定の画面レイアウトや操作環境に依存しない、汎用性の高い業務知識として活用できるようになります。
従来のRPAが「この座標をクリックする」という具体的な操作しか記録できなかったのに対し、cotomi Actは「顧客情報を確認してから適切な処理方法を選択する」といった、より高次元の業務ロジックを理解・実行できます。
cotomi ActとRPAの違いを理解することで、この技術の革新性がより明確になります。
比較項目 | 従来のRPA | cotomi Act |
---|---|---|
操作の記録方法 | 操作内容をそのまま記録 | 操作の意味と背景を理解して抽象化 |
環境変化への対応 | 画面レイアウト変更で動作停止 | 意味を理解しているため柔軟に対応 |
判断能力 | 事前に定義された条件分岐のみ | 暗黙知に基づく高度な判断が可能 |
学習能力 | 新しい操作は手動で追加 | 継続的に暗黙知を学習・更新 |
この違いにより、cotomi Actは従来のRPAでは対応困難だった複雑で専門性の高い業務も、高精度かつ自律的に遂行できるようになります。
cotomi ActはWebブラウザの拡張機能として動作するため、特別なシステム導入や大規模なインフラ変更が不要です。既存のブラウザ環境にプラグインを追加するだけで、すぐに暗黙知の抽出と業務自動化を開始できます。
操作も直感的で、自然文による指示でブラウザ操作を自動実行できます。ユーザーの曖昧な指示に対してもAIエージェントが暗黙知から必要な知識を見分け、適切な情報や手続きを自動で検索・選択する仕組みが構築されています。
例えば、「顧客Aの契約状況を確認して、適切な提案資料を準備してください」といった抽象的な指示でも、過去の操作履歴から学習した暗黙知をもとに、必要な画面遷移、情報収集、資料選択を自動的に実行できます。
cotomi Actの導入により期待される業務効率化の効果は多岐にわたります。
従来のAIでは扱いが困難だった現場に根付く専門知識を活用できるため、複雑で専門性の高い業務の高度化・自動化が可能になります。ベテラン社員の長年の経験で培われた直感やノウハウもデータとして取り込み、新人でもベテラン並みの判断ができる環境を構築できます。
cotomi Actは一度設定すれば終わりではなく、継続的に操作履歴から新しい暗黙知を学習し、業務プロセスを改善していきます。組織の業務ノウハウが蓄積されるほど、より高精度で効率的な自動化が実現されます。
特定の担当者にしかできない業務を暗黙知として抽出・共有することで、業務の属人化を解消し、組織全体の生産性向上に貢献します。
NECの「cotomi Act」は、AI業界における画期的な技術革新として注目されています。主要なポイントを以下にまとめます:
この技術は、単なる業務効率化ツールを超えて、組織の知識管理と業務プロセス革新に大きな変革をもたらす可能性を秘めています。AI技術の進歩により、人間の暗黙知さえもデータ化・活用できる時代が到来したことを示す、象徴的な技術といえるでしょう。
本記事の内容は、以下の資料も参考にしています:
cotomi Actは、NECが開発したAIエージェント技術で、ブラウザ上の操作履歴から暗黙知を自動抽出し、形式知化することで、業務を自動化します。従来のRPAと異なり、操作の意味や背景を理解し、高度な判断を伴う業務も自動化できる点が特徴です。
従来のRPAは操作内容をそのまま記録・再現しますが、cotomi Actは操作の意味や背景を理解し抽象化します。そのため、画面レイアウトの変更など環境変化に強く、暗黙知に基づいた高度な判断が可能です。また、継続的に学習し業務プロセスを改善します。
WebArenaは、AIモデルが実際のウェブサイト上でタスクを実行する能力を測定する国際的な評価プラットフォームです。cotomi Actはこのベンチマークで、人間のタスク成功率を上回る世界初の成果を達成しました。
cotomi ActはWebブラウザの拡張機能として動作するため、既存のブラウザ環境にプラグインを追加するだけで導入できます。特別なシステム導入や大規模なインフラ変更は不要です。
cotomi Actの導入により、専門業務の自動化、継続的な学習と改善、属人化の解消が期待できます。ベテラン社員のノウハウをデータ化し、組織全体で共有・活用できるため、業務効率化と生産性向上に貢献します。
Workstyle Evolution代表。18万人超YouTuber&『ChatGPT最強の仕事術』著者。
株式会社Workstyle Evolution代表取締役。YouTubeチャンネル「いけともch(チャンネル)」では、 AIエージェント時代の必須ノウハウ・スキルや、最新AIツールの活用法を独自のビジネス視点から解説し、 チャンネル登録数は18万人超(2025年7月時点)。