ESGデータからシグナルを探せ

Read the English version published on May 27, 220.

近年、環境・社会・ガバナンス(ESG)をめぐる問題や、企業が発表するESGの影響を測定するデータに注目が集まっています。ESGが注目を集める一方で、実際に投資家がポートフォリオの組み入れ企業を評価する際にESGデータが役に立つのかという議論もされるようになりました。ただ、ESG要因が投資と正の相関にあるという学術的な証左は出ており、いくつかの研究で、サステナビリティの点で優れている企業が、劣っている企業よりも高い投資リターンを生み出していることが示されています。

それでも、これまで一般的には、ESGデータを実用的な投資シグナルに変換することは非常に困難といえました。問題点としてよく指摘されるのは、ESG関連データが不足している点のほか、報告の枠組みの要件も標準もないためにバイアスの影響を受ける可能性があることです。そこでブルームバーグのリサーチチームでは、機械学習のテクニックをブルームバーグの膨大なESGデータセットに適用することにより、これらの課題を解消できないかについて調査を行いました。

ブルームバーグのESGデータ

ブルームバーグは、世界各国の約1万3000社に関して2006年までさかのぼって年次ESGデータを提供しています。さらに、この企業群のうち約4500社で構成されるサブセットに関しては、2013年までさかのぼった日次ガバナンスデータも提供しています。主な調査対象を、日次データが入手可能な米国上場企業をとしたところ、仮想ESGポートフォリオに組み込み可能な銘柄数は調査当時で3000を超えていました。

機械学習戦略

ESGに焦点を当てた投資は一般に長期的な株価パフォーマンスを目標とするため、この調査では各種ESG指標を長期リターンに直接関連付ける手法が取られました。具体的には、機械学習モデルを構築し、データセットに含まれる各銘柄の年次超過リターンを、ブルームバーグのESGデータ別に分類しました。年次超過リターンはラッセル3000指数との比較で測定され、プラス15%超、マイナス25%未満、そしてその間という3つのカテゴリーに分類されました。

ここで、勾配ブースティング・ツリー(GBT)(Gradient Boosting Tree)モデルを使用して、各企業のESGアプローチに関するデータに基づき、その企業の超過リターンがどのカテゴリーに該当するかを予測しました。GBTの大きな利点の1つとして、欠損値を処理する能力を本質的に備えているため、特別な処理を必要としないという点があげられます。

説明可能性

機械学習のアプローチでポジティブな結果が得られたため(シャープレシオはベンチマークの0.73に対し1.25、アルファは8.7%)、リサーチチームは次に、この機械学習モデルの説明可能性を検証しました。ここで、「SHAP(Shapley Additive Explanations)」と呼ばれるゲーム理論の手法を用い、モデルのパフォーマンスに大きく影響する主要データの特徴が特定されました。その結果、これらの特徴に基づいた完全に説明可能で単純な回帰モデルが構築されていることが判明し、そしてこれらの特徴は比較として用いられるとともに、これらの特徴だけを基に機械学習モデルの再学習が実行されていました。

一般的ではない要因

この調査で構築されたポートフォリオは全て、Fama/French 5ファクターモデルの属性に対してテストされました。このファクターモデルとの比較で最大のアルファが得られたのは、説明可能性テストで上位となったいくつかの特徴に基づいて学習した機械学習モデルの結果でした。さらに、5つの要因のうち統計的に有意だったのは2つのみで、しかもさほど大きな有意性ではありませんでした。このことは、ESGデータが一般に使われる要因とは相関関係がない独自の投資に関する知見を提供する可能性を示しています。

本調査の詳細と機械学習戦略をESGデータに適用する方法を参照するには、こちらから資料をダウンロードください。