Read the English version published on February 04, 2021.
新型コロナウイルスのパンデミック(世界的大流行)の発生を機に、世界の株式市場は2020年序盤から高ボラティリティ期に入りました。ボラティリティが発生したことで、オルタナティブ(代替)データが発するシグナルを基に投資パフォーマンスを評価するという自然実験が可能になりました。下部にリンクのある資料では、オルタナティブ・データが発するシグナルに単純かつ直感的なルールを当てはめて、リスク・リターン特性が優れたポートフォリオを構築しました。まずは個々のシグナルを別々に用いたポートフォリオを作成し、最終的には、アンサンブル法のようにシグナルを組み合わせて利用した方が有用な結果が得られることを明らかにします。また、従来の一般的な手法(ベータヘッジなど)を適用することで反復改善法による修正を独自モデルに何度か加え、一般的な手法とオルタナティブ・データ・シグナルとの関係性も説明します。さらに、使用したオルタナティブ・データ・シグナルの説明や、その評価方法にまつわる課題の解説も加えています。
パンデミック相場
S&P 500種株価指数は2020年2月19日に当時の最高値を更新しました。その後まもなく、米国株式市場は新型コロナのパンデミックに伴うボラティリティに襲われますが、およそ6カ月後の2020年8月18日には、S&P 500種は再び最高値を更新します。本稿執筆中の現在、パンデミックは収束にはほど遠い状況にありますが、2月18日(前回の最高値更新の前日)から8月18日(再度の最高値更新日)までの6カ月間を一区切りとして米国株式市場を振り返り、この期間にさまざまな投資戦略がどのようなパフォーマンスを残したのかを調査できます。
オルタナティブ・データから得られるシグナル
投資の新たな側面として大きな話題になっているものの1つに、オルタナティブ・データがあります。今回の調査において、データ提供社6社が金融市場の投資家向けに付加価値を提供する目的で作成した6つのデータセットに注目しました。ABC順に挙げると、Brain Machine Learning Stock Ranking、Chaikin Equity Analytics、Sentifi Company S&P 500、Tenviz Equity Positions、Trendrating Analytics Americas、Wisdomain Company Patent Portfolioの6つです。いずれのデータセットも、ブルームバーグのエンタープライズ・データ・プラットフォームを通じて試用と購入が可能です。また、データセットの期間は今回の調査対象期間をスタート時点からカバーしています。
6つのデータセットはいずれも、「すぐに使える投資シグナル」とみなせるデータを含んでいますが、これは次の2つの理由から重要といえます。第1に、数値を正規化するだけで簡単にシグナルを組み合わせられます。第2に、基本設定を行うだけで、すぐに6つのデータセットの利用を開始できます。つまり、複雑なデータセットに組み込まれた知見を、アクションにつながる単一のデータ要素に転換するには、本来ならモデリングの作業が必要になりますが、これを回避できるのです。特に今回は調査対象期間が非常に短くモデルのオーバーフィッティングが容易に起こりうるため、モデリングが不要であることは強みとなります。
モデリングとオーバーフィッティング
この調査で特に注意を払ったのは、すべての判断を直感的かつ全体的に単純なものにすることです。つまり特定の状況や分野に合わせたり、何らかの最適化によって判断を導いたりすることは避けました。モデリングを使用しなくても確かな結果が得られたのは、基礎となるデータセット自体に価値ある知見が含まれている証拠といえます。しかしデータセットを最大限に活用したいと考える場合は、もちろんモデリングの手順を踏むことも可能ですし、そうすべきでしょう。6つのデータセットはいずれも大量の過去データを含んでいるので、それらすべてを考慮に入れた機械学習モデルがあれば、興味深く有用なパターンが見つかる可能性があるでしょう。
分析結果
最終的な結果は、アルファが年率約40%、ベータがほぼ0%となりました。単純なデータ変換とポートフォリオ・ルールを6つのオルタナティブ・データ・ソースから生じたシグナルに適用することで、パンデミック相場の6カ月間にS&P 500種株価指数よりも優れたリターンを生むことができたのです。オーバーフィッティングを避けるために複雑なモデリングは一切行いませんでしたので、この目覚ましい結果は、基礎となったデータセットの潜在力を物語っている、といえるでしょう。今回の調査における最も重要な点は、シグナルを別々に使用するのではなく、互いに組み合わせて使用した場合にオルタナティブ・データの力が増大する可能性があることが明らかなった点でしょう。このことはまた、シグナルの評価においても重要な意味を持ちます。つまり、有用な知見を得る確率を最大限に高めるには、シグナルはリソースが許す限り、組み合わせて総合的に評価するべきという点です。
ブルームバーグ経由で取得可能なオルタナティブ・データを活用して知見を得る方法については、資料(英語)をダウンロードして詳細をご覧ください。
本稿は英文で発行された記事を翻訳したものです。英語の原文と翻訳内容に相違がある場合には原文が優先します。