マイケル・ショプフ, CFA
アナリストに競争相手が現れた。その相手は人間ではない
先日、6つのAIモデルが、経験豊富な株式アナリストとSWOT分析で対決しました。その結果は驚くべきものでした。多くの場合、AIは単に互角に渡り合っただけでなく、人間の専門家が見落としていたリスクや戦略上のギャップを明らかにしたのです。これは机上の空論の話ではありません。私たちは、ドイツテレコム(ドイツ)、第一三共(日本)、そしてカービー・コーポレーション(米国)の3社を対象に、アナリストのコンセンサスに対する最先端の大規模言語モデル(LLM)の比較テストを実施しました。いずれの企業も、2025年2月時点でそれぞれの業界において最も強気の評価を受けていた銘柄でした。アナリストたちが圧倒的に支持する、いわば「間違いのない投資先」とされていた銘柄です。
私たちがあえて市場の人気銘柄を選んだ理由は、もしAIが、人間の目には強みにしか見えないところに、弱みを見出すことができるなら、それは非常に強力なシグナルとなるからです。これにより、AIが単にアナリストの作業を補完するだけでなく、従来のコンセンサス思考に異議を唱え、投資リサーチの進め方そのものを進化させる可能性を示しています。
AIパフォーマンスの不都合な真実
ここで、あなたをハッとさせる事実があります。高度なプロンプト設計(訳注:適切な命令文の設計)により、一部のLLMは、分析の具体性と深さにおいて人間のアナリストを上回ったのです。この事実を、じっくりと受け止めてください。
AIは、業界で長年経験を積んできたプロのアナリストよりも、より詳細かつ包括的なSWOT分析を作成しました。しかし、人間のアナリストが不要になると結論づける前に、重要な留意点があります。AIは、データの統合やパターン認識には優れている一方で、CEOのボディランゲージを読み取ったり、経営陣の「慎重ながらも楽観的」といったガイダンスに込められた微妙な含意を察知したりすることはできません。あるポートフォリオ・マネージャーは、私たちに次のように語りました。「経営陣が自社をどのように捉えているかを理解するのに、彼らと直接話すことに代わる手段などありません。」
すべてを変える「40%の差」
最も衝撃的だった発見は何でしょうか?それは、高度なプロンプト設計によって、AIのパフォーマンスが最大40%向上したという点です。例えば、「ドイツテレコムのSWOTを教えて」と尋ねるのと、詳細な指示を与えるのとでは、出力結果の質に、ウィキペディアの要約と、機関投資家向けのリサーチレポートほどの差が生じます。これはもはや「選択肢」ではありません。プロンプト・エンジニアリングは、2000年代におけるExcelと同じくらい、不可欠なスキルになりつつあります。このスキルを習得した投資のプロフェッショナルは、AIツールから指数関数的に多くの価値を引き出すことができるでしょう。一方、このスキルを習得しない者は、わずかな時間でより優れた分析結果を生み出す競争相手を、ただ見ているしかなくなるでしょう。
AIモデルのヒエラルキー:すべてのAIが同じではない
私たちは、以下の最先端のAIモデル6つをテストし、ランク付けしました。
1. Google Gemini Advanced 2.5(Deep Researchモード) — 明確な勝者
2. OpenAI o1 Pro — 優れた推論能力を誇る僅差の2位
3. ChatGPT 4.5 — 安定性はあるが、上位モデルには明確に及ばない
4. Grok 3 — イーロン・マスクが手掛ける、将来有望な挑戦者モデル
5. DeepSeek R1 — 中国発のダークホース。処理速度は高速だが洗練度に欠ける
6. ChatGPT 4o — 比較用のベースラインモデル
推論に最適化されたモデル(「Deep Research」機能を備えたモデル)は、標準的なバージョン(例:ChatGPT-4o)を一貫して上回るパフォーマンスを示しました。これらのモデルは、より豊富な文脈情報を提供し、事実確認に優れ、そして定型的な表現が少ないという特徴を有していました。シニアアナリストとジュニアアナリストを雇うようなものだと考えてみましょう。どちらも仕事はこなせますが、前者は細かい指示をほとんど必要としません。処理時間も重要です。最上位のモデルは、包括的なSWOT分析の生成に10〜15分を要しましたが、簡易モデルは1分未満で出力しました。思考時間と成果物の質の間には直接的な相関関係があります。これは人間のアナリストなら誰もが以前から知っていることです。
ヨーロッパのAI劣位:戦略的な脆弱性
ヨーロッパの読者にとって、耳の痛い現実があります。今回テストしたAIモデル6つのうち、5つは米国製、1つは中国製でした。ヨーロッパがこのAIの主導権争いに一切登場していないことは、単なる屈辱ではなく、戦略的に極めて危険な状況です。中国から生まれたDeepSeekは、西側モデルと比べてごくわずかなコストで高い性能を示したため、これを「AI版スプートニク・ショック」と捉える向きもありました。
この事実が突きつけるメッセージは明確です。AIの主導権は急速に移り変わる可能性があり、自前の技術的基盤を持たない国・地域は、技術的に依存せざるを得ないリスクを抱えることになります。ヨーロッパのファンドマネージャーにとって、これはつまり、重要な分析を外国製AIに頼らざるを得ないことを意味します。これらのAIモデルは、FRBの声明を理解するのと同程度に、ECBの発表やドイツの規制文書を理解していると言えるのでしょうか。この問いに対する答えはまだ出ていないものの、リスクは確実に存在しています。
実践的なAI統合のプレイブック
私たちの調査結果から、投資のプロフェッショナルがこれらのツールを活用するための明確な4ステップのアプローチが導き出されました。
1. 置き換えではなく、ハイブリッド活用
AIには、初期調査、データの統合、パターンの特定といった負荷の大きなタスクを担わせます。一方、解釈や戦略、経営陣の思考を深く理解する力といった部分は、人間が判断すべきです。最適なワークフローは、AIが下書きを作成し、人間がそれを洗練させることです。
2. プロンプト・ライブラリは新たなアルファの源泉
汎用的なタスクには標準化されたプロンプトを整備しましょう。精緻に設計されたSWOT分析用のプロンプトは知的財産です。ベストプラクティスは社内で共有してもよいですが、最も優れたプロンプトはトレーディング戦略のように慎重に扱うべきです。
3. モデル選定の重要性
深い分析には、推論に最適化されたモデルに対価を支払うべきです。一方で、簡潔な要約には標準モデルで十分です。複雑な分析にGPT-4oを使うのは、銃撃戦にナイフで挑むようなものです。
4. 継続的評価
新しいモデルは、ほぼ毎週のように登場しています。私たちが示すAIモデル評価のフレームワークは、6つの評価基準、すなわち構造、妥当性、具体性、深さ、クロスチェック、メタ評価から構成されます。そして、このフレームワークにより、最新モデルが、本当に前世代のモデルを上回っているかどうかを一貫して評価することができます。詳細については、完全版の調査レポート「Outperformed by AI: Time to Replace Your Analyst?(AIに打ち負かされたアナリスト-もはや交代すべきときか?)」(マイケル・ショプフ(Michael Schopf)、2025年4月)をご参照ください。
SWOT分析を超えて:拡張し続けるフロンティア
今回はSWOT分析に焦点を当てましたが、その示唆は投資プロセス全体に広がります。以下にいくつかの具体例を挙げますが、これらはその一部に過ぎません。
l 決算説明会の要約と分析が、数時間ではなく数分で完了する
l ESGレッドフラグ(リスク要因)をポートフォリオ全体から検出
l 膨大な規制当局への提出書類の分析
l 競合企業に関する情報の収集・分析
l 市場センチメントの統合と評価
これらの活用例はいずれも、人間のアナリストをより高付加価値の業務へと解放します。もはや「AIを導入すべきかどうか」が問題ではありません。「いかに早く、効果的に統合できるか」こそが、問うべき問題なのです。
不都合な疑問への回答
多くの人が心の中で思っている疑問を、一緒に考えていきましょう。
「AIはアナリストを置き換えるのでしょうか?」:完全に置き換えるわけではないものの、AIを使いこなせないアナリストは置き換えられていくでしょう。人間とAIの組み合わせは、どちらか単独だけの場合よりも優れた成果をもたらします。
「AIの出力結果は信頼できるのでしょうか?」:「信頼せよ、されど検証せよ(Trust but verify、注:ロシアの諺をロナルド・レーガン元大統領が引用した発言)」。AIは事実を誤って生成、すなわち“幻覚”することもあれば、文脈を見落とすこともあります。特に投資判断においては、人間による監督が依然として不可欠です。
「どのAIモデルを使うべきでしょうか?」:複雑な分析には、Gemini Advanced 2.5 や o1 Pro(もしくはそれらの後継モデル)から始めましょう。ただし、技術の進化が早いため、四半期ごとにモデルの見直すことをお勧めします。
「もし競合がAIを自分たちより上手く使いこなしたらどうなるでしょうか?」:その場合、彼らがアルファ(超過収益)を獲得している間に、あなたは後手に回り、追いかける立場に置かれることになるでしょう。競合がAIによる優位性を築いていく中で、あなたが傍観しているということは、激しさを増す競争環境の中で市場での立場を失っていくことを意味するのです。
今後の道筋
もはや「魔法の精」は瓶の外に出てしまいました(注:一度起こった変化は元に戻らない)。LLMは、かつて数日かかっていた分析作業を、数秒で実行できることを実証しました。LLMは、迅速な処理能力、一貫した出力品質、そして膨大な知識基盤を有しています。効果的に活用すれば、決して疲れることのないジュニアアナリスト部隊を抱えているようなものです。しかし、ここで重要な点は、成功には、AIの全体的な置き換えではなく、思慮深く戦略的に設計された統合が不可欠であるということです。
AIの出力結果は、ジュニアアナリストの下書きとして扱うべきです。すなわち、価値あるインプットではあるものの、必ずシニアによるレビューが必要となります。プロンプト・エンジニアリングを習得すること、賢明にモデルを選択すること、人間による監督を維持することが重要です。ヨーロッパの専門家には、もう一つ使命があります。それは、ヨーロッパにおけるAI開発を推進することです。金融インフラという中核領域で技術的に依存することは、いかなる地域においても許容できない戦略的脆弱性となるのです。
ツールを制するか、ツールに制されるか
これらのツールを賢く受け入れるのでしょうか、それとも競合が先に進むのを見送るのでしょうか。この新たな環境で勝者となるのは、AIの計算能力と、人間の洞察力、直感、関係構築力を融合できる人材です。投資分析の未来は、「人間かAIか」ではなく、「人間とAI」です。この現実を理解し、行動に移す人々が成功を手にすることでしょう。そのように行動できない人々は、機械に打ち負かされるのではなく、機械を使いこなすことを学んだ人間に敗れることになるでしょう。
あなたが次に採用するアナリストは、いまだに休憩を必要としているかもしれません。しかし、そのアナリストは、LLMに適切なプロンプトを与え、その出力結果を的確に評価し、そしてデータをアルファに変換する人間洞察の付加手法を身に着けているべきです。なぜなら2025年において、それが新たなスタンダードとなっているからです。ツールはすでに存在していますし、フレームワークも整っています。それらを使いこなす方法を知っている人材こそが勝者となるでしょう。
全文はこちらからご覧いただけます。
この投稿が気に入られたらEnterprising Investorのご購読をお願い致します。
(翻訳者:河野俊明、CFA、CAIA、CPA)
和文オリジナル記事はこちら
https://blogs.cfainstitute.org/investor/2025/06/23/outperformed-by-ai-time-to-replace-your-analyst/
注) 当記事はCFA協会(CFA Institute)のブログ記事を日本CFA協会が翻訳したものです。記事内容は執筆者の個人的見解であり、投資勧誘を意図するものではありません。
また、CFA協会または執筆者の利用者の見方を反映しているわけではありません。