AIの「いびつな知能(Jagged Intelligence)」をどう克服するか?エンタープライズAIを成功に導くeVerseとEGIの全貌
2026/03/14
現在のAI業界において、多くのCTOやAIアーキテクトが頭を悩ませている最大のジレンマがあります。それは「Jagged Intelligence(いびつな知能)」と呼ばれる現象です。
最新の大規模言語モデル(LLM)は、司法試験に合格し、複雑なコードを書き上げる一方で、日常的なビジネスルールの適用や単純な論理パズルにおいて予期せぬ致命的な失敗を犯します。消費者向けアプリケーションであれば90%の精度でも許容されるかもしれませんが、企業の基幹業務や顧客対応において、小さなエラーやハルシネーション(もっともらしい嘘)は甚大なリスクに直結します。エンタープライズ環境では、99%の絶対的な精度と信頼性が求められるのです。
本記事では、LLMの「スケーリング則」が限界を迎えつつある2026年の技術的現実を踏まえ、本番環境でのリスクを排除するSalesforceのシミュレーション環境「eVerse」と、「エンタープライズ汎用人工知能(EGI)」という新たなパラダイムについて解説します。
1. LLMスケーリング則の終焉と新たな技術的現実
過去10年、AIの進化は「計算資源とデータを増やせば性能が上がる」というスケーリング則に牽引されてきました。しかし、2025年から2026年にかけて、このアプローチは明確な限界(限界効用逓減)に直面しています。
高品質な学習データの枯渇や、計算コストの指数関数的な増大により、「単にモデルを大きくする」という総当たり的なアプローチは、技術的にも財務的にも持続不可能になりつつあります。
| 指標カテゴリ | 従来のパラダイム (〜2024年) | 新たな現実 (2025年〜2026年) |
| パフォーマンス向上 | スケーリングに比例して線形に向上 | 限界効用逓減(Saturation Point)に到達 |
| データソース | ウェブ上の公開テキストデータの大量スクレイピング | 高品質データの枯渇、モデル崩壊のリスク |
| 評価の焦点 | 汎用ベンチマーク(司法試験など)のスコア | エンタープライズ特化のタスク完了率と一貫性 |
この限界と同時に顕在化したのが「Jagged Intelligence」です。企業内の業務プロセスは、複数システムをまたぐマルチターンのやり取りが前提です。汎用LLMが多段階のプロセスで破綻するのは、特定のエンタープライズが持つ「メタデータ構造」や「厳格なビジネスルール」を構造的に理解していないためです。
2. AGIから「EGI(エンタープライズ汎用人工知能)」への転換
AIの不確実性を排除し、ミッションクリティカルな要件を満たすためにSalesforceが提唱しているのが**EGI(Enterprise General Intelligence)**です。
SF的な超知能(AGI)ではなく、ビジネスアプリケーションに特化して最適化され、「能力」と「一貫性」を兼ね備えた目的特化型のAIエージェントを指します。EGIの実現には、長期的視野に基づく推論、動的なルールへの適応、そして深い調査分析能力が不可欠であり、これらはLLM単体ではなく、RAGやメタデータリポジトリなどを含む統合インフラストラクチャによって初めて実現します。
3. eVerse:合成データによる「AIのシミュレーション・ジム」
未成熟なAIを本番環境にデプロイし、顧客とのやり取りの中で「実行時(オンザフライ)」に学習させるのは、コンプライアンス面でもレピュテーション面でも許容できないリスクです。
この課題を解決するのが、Salesforce AI Researchが開発したエンタープライズシミュレーション環境「eVerse」です。eVerseは、以下の3つのフェーズでAIエージェントを鍛え上げます。
-
Synthesize(合成): ユーザーのSalesforce組織のメタデータ(設計図)を読み込み、現実の企業環境と寸分違わない「デジタルツイン」を構築。GDPR等に完全準拠した架空のデータを無限に生成し、安全な学習環境を作ります。
-
Measure(測定): AIを複雑なクエリのストレステストにかけ、「AI審査員(Judge Agent)」が失敗モード(コンプライアンス違反や論理矛盾など)を精密に測定します。
-
Train(訓練): 人間の専門知識に導かれた強化学習(RLHF)を用いてエージェントの行動を修正。失敗から学習させ、精度を急速に向上させます。
データによれば、このループを適用した結果、AIエージェントのエンタープライズタスク成功率は初期の19%から約88%へと飛躍的に向上しています。
4. 実証データが語るeVerseの威力
ユースケース1:極限の音響環境を克服する「Agentforce Voice」
2026年2月に日本でリリースされるAgentforce Voiceの開発では、eVerseによる過酷な音声シミュレーションが実施されました。劣悪な通信環境、背景雑音、会話の混線、そして怒りを感じている顧客といった「劣悪な会話」を意図的に合成。AIが不適切な発言をしないよう厳格なガードレールを確立し、超低遅延で自然な会話を実現する99%の安全性を担保しました。
ユースケース2:UCSF Healthにおける医療費請求の革新
専門用語と厳格な法令遵守が求められる医療分野。UCSF Healthでは、月に約9,000件寄せられる複雑な医療費請求の問い合わせ対応にeVerseを導入しました。AIが未知のシナリオに直面した際、ハルシネーションを起こす前に人間の専門家にエスカレーションし、その対応プロセスをAIが学習するハイブリッドループを構築しました。
| UCSF Health パイロットテストの主要指標 | 実証データ |
| 月間医療費請求問い合わせ件数 | 約9,000件 |
| 従来のAIによる解決率 | 60% 〜 70%(業界標準のベースライン) |
| eVerse訓練後のAI解決率 | 約80%へ向上(最新データで84% 〜 88%) |
| 運用へのインパクト | スタッフは最も複雑な12%〜16%の重要タスクに完全に集中 |
この劇的な解決率の向上により、人間の専門家は単調な電話対応から解放され、真に高度な判断と共感を必要とする業務に専念できるようになりました。
5. 結論:CTOへの戦略的指針
「Jagged Intelligence」の罠を回避し、AIをミッションクリティカルな業務に適用するためには、検証されていない「オンザフライ」の学習を避けるべきです。
自社のデータスキーマとビジネスロジックを反映した「シミュレーション・ジム(eVerse)」での徹底的な事前学習とストレステストこそが、これからのAI技術スタックの中心となります。合成データとシミュレーション環境を活用した継続的な最適化ループの確立が、AIと人間がシームレスに協調する「エージェンティック・エンタープライズ」への最も確実な道筋です。
----------------------------------------------------------------------
カズテム
住所 :
東京都板橋区加賀1丁目1−3
電話番号 :
090-5758-8650
Salesforceのシステム開発
----------------------------------------------------------------------