機械学習からの洞察を取り入れたクオンツメソッド

Read the English version published on January 15, 2021.

近年、機械学習は金融の重要なテーマとなりました。その応用事例には信号検出、オルタナティブデータ処理技術、ファクター投資、ポートフォリオ最適化、SNSのセンチメント分析やアノマリー検出のための自然言語処理などがあります。機械学習のおかげでオートメーション(自動化)や分析機能の面では大きな進歩が見られた一方で、人工知能(AI)や機械学習には注意すべき点が数多くあり、バイアス、過剰適合、疑似相関などのよくあるわなに陥らないよう注意する必要があります。このようなテクノロジーを効果的かつ安心して使用するためには、特定のアプローチの強みと弱みおよびその結果について科学的な厳密性をもって明確に認識した上で、学習とプラクティスを続けていく必要があります。そうした意味でウェビナーは、専門家に会って難しい質問をぶつけその意見を聞くには絶好の機会です。

ブルームバーグのTech Decodedシリーズの最初のウェビナーでは、イリノイ工科大学で応用数学の助教を務めるMatthew F. Dixon氏およびニューヨーク大学タンドン・スクール・オブ・エンジニアリングで金融機械学習のリサーチプロフェッサーを務め現在はフィデリティ・インベストメンツAI資産運用のVPであるIgor Halperin氏が、金融における機械学習応用の歴史と現状について講演を行いました。ブルームバーグのCTOオフィスでクオンツリサーチソリューションのヘッドを務めるArun Vermaに紹介されたDixon氏は、ディープラーニング(深層学習)のファクターモデルへの応用(非線形性、交互作用効果、ファクターランキングなど)について解説しました。

機械学習からの洞察を取り入れた従来のクオンツメソッド

金融市場において機械学習への関心が高まる中で、機関投資家はこの技術を既存の金融モデル体系に組み込む方法を模索しています。こうしたモデルには既に定量的な要素が組み込まれており、そうした従来からの方法を維持した上で、機械学習が分析力や商品ラインアップを強化してくれることを期待しています。これまでの研究結果としては、実験的なデザイン、ファクター感応度の精査、外れ値の捕捉と評価、リターンの説明可能な要素と説明不可能な要素への分解などがあります。

ディープラーニングはリターンの非線形性を自動的に捕捉することができるため、さまざまな分析が可能となります。また、線形モデルや2次モデルでは高次相互作用と外れ値の影響は捕捉できませんが、ディープラーニングであればその重要な影響を特定し調べることができます。ディープラーニングモデルから得られるファクター感応度を線形・2次モデルから得られるファクター感応度と比較して分解を実行し、ディープラーニングモデル、線形モデル、2次モデルの違いを説明することも可能です。

具体的なリサーチの事例として、Dixon氏は、シカゴ大学ブース・スクール・オブ・ビジネスで計量経済学および統計学の教授を務める英国人統計学者Nicholas G.Polson氏との共同研究について話しました。50ファクターを用いたディープラーニングモデルを30年間にわたってラッセル1000指数の3000を超えるアセットに適用してインフォメーションレシオ(IR)を算出しました。次に得られた数値を最小2乗回帰(OLS)モデルおよびLASSO回帰モデルから得られた数値と比較しました。その結果、50ファクターモデルから算出されたIRは、OLSモデルから算出されたIRより1.5倍大きくなりました。また、50ファクターモデルは相互作用への感応度が低く、全般的に優れたパフォーマンスを示しました。将来的には信頼区間を使ってファクター感応度を拡張し、文脈分析やリスク分解、分析などを行うことが考えられます。

強化学習と逆強化学習―エージェントと行動

Dixon氏の講演に続いてHalperin氏が、強化学習(RL)と逆強化学習(IRL)の金融への応用について講演しました。強化学習は、エージェント、環境における行動、次の行動を決定するフィードバックループ(この形式の機械学習に固有のもの)から構成される逐次的意思決定の1つの形式です。環境は時の経過とともに変化する可能性があるので、強化学習には計画と予測も含まれます。

実務的な応用としては、ポートフォリオ管理を強化学習のタスクとして構成することができます。システムが売り買いの判断を行うとともに、キャッシュを預金するか、引き出すかも選択します。このケースにおいてフィードバックループは、大規模な取引(または的を絞った数多くの小規模取引)が市場価格に及ぼす影響となります。強化学習とは対照的に、逆強化学習は既に行われた一連の判断を評価し、具体的な報酬を観察することなくエージェントの効用(報酬)関数を学習します。逆強化学習に適したタスクの事例としてはポートフォリオの最適化があります。その目的は投資戦略の推察および改善です。また、別のエージェントの効用関数の学習も逆強化学習に適しています。

単純なモデルから始め、必要に応じて拡張

Halperin氏は、強化学習および逆強化学習は最適制御の問題を解決するのに役立つデータドリブン型のパラダイムであると指摘します。ディープラーニングや深層強化学習のライブラリーは数多く存在しますが、Halperin氏は、最初はエージェントと報酬の単純なモデルから始め、最適制御のための標準的な方法を組み込み、必要であればニューラルネットに拡張することを勧めています。

金融における強化学習と逆強化学習の将来的な応用について、Halperin氏はさらに2つのアルゴリズムについて話を続けました。1つは取引活動からの弱いシグナルを捕捉してシャープレシオを改善するG-learnerで、もう1つは観察された行動に基づいてG-learnerエージェントから報酬パラメータを推察するGIRLです。この2つを使って、実際の投資家を貯蓄および投資行動の観点からクラスター化されたG-learnerとしてモデル化することができます。そこではGIRLを投資家のロボアドバイザーとして使用することができます。また、すべての市場参加者の行動とダイナミクスを組み込んだより広範なマーケットエージェントに逆強化学習を適用することもでき、これは市場の「見えざる手」を逆強化学習でモデル化するアプローチとなります。

講演終了後、Dixon氏とHalperin氏はオンラインQ&Aセッションの形で聴衆の質問に答え、2人の最近の著書『金融における機械学習:理論から実践へ(未邦訳:Machine Learning in Finance: From Theory to Practice)』の内容も紹介しました。

Tech Decodedシリーズについて

Tech Decodedウェビナーシリーズは、堅牢な機械学習モデルの構築に関する実務的なガイダンスからテクノロジーが金融市場とそこで働く人々に及ぼす影響の予測まで、優れたAIリサーチャーやデータサイエンティストの知見と洞察を提供しています。

本稿は英文で発行された記事を翻訳したものです。英語の原文と翻訳内容に相違がある場合には原文が優先します。

日本語ブログ記事をメールでお届け ニュースレターご購読はこちらから