機械学習の時代と金融情報の未来

本稿はブルームバーグのエンタープライズデータ部門の責任者であるGerard Francisによって執筆されました。英語原文はこちら

金融業界はかつてないスケールで、市場全体を変化させるようなテクノロジーイノベーションを経験しています。

データへのアクセスがこの急速な変革を支えています。意思決定者の皆さまにとって利用可能なデータの量、複雑性、多様性は、ここ数年間で指数関数的に高まっている一方で、断片化も進行しています。IBMは、世界に現存するデータの9割が実は過去2年間に生成されたものであると指摘しています。

データおよびオルタナティブ・データ、機械学習、自然言語処理という3つの要素が集結することで、世界の資本市場の投資家が入手可能な情報を抽出・消費・分析する方法は根本的に変化しています。その結果、投資会社のトレーディング戦略やビジネス・インテリジェンスの差別化手法も大きく変化しています。

データの課題  – 多様化が進む一方で、断片化も進行

金融機関のデータプールは巨大で細分化されています。データプールには、多くの市場関係者になじみのある従来の基本データ(企業業績や証券価格)だけではなく、商取引などの事業プロセスによって生み出されるデータ、衛星情報のように機械が生成するデータ、そしてソーシャルメディアなど従来とは異なる情報源から得られるデータも含まれます。

時代の最先端を行く投資家の皆さまはアルファを捉えるため、新たな関連性のある投資シグナルの発見に重点を置いた新技術を用いたオルタナティブ・データセットの活用にこれまで以上に注目しています。リーダーの皆さまは証券価格や企業業績だけでなく、衛星画像、サプライチェーンに関する情報、ESG要素、さらにはツイートまでも理解する必要があるでしょう。

オルタナティブ・データは投資決定に厚みを増しますが、データを読み取ってトレーディングやポートフォリオの運用との関連性が高い情報として活用するには、過去実績や共通のフォーマットに基づいたデータが必要不可欠です。

金融業界は膨大な量のデータを生み出しています。ブルームバーグは1日に1,000億件の市場データ・メッセージを受け取り、12万5,000件の情報源から一日あたり200万件の新たなニュースを取り込み・処理しています。機械学習アルゴリズムと自然言語処理を駆使した当社の予測分析ツールは、それらすべてを選別し最も重要な情報を抽出して投資家に提供します。

現在、市場参加者と金融機関の皆さまにとって最大の課題は、利用すべきデータセットを特定し、それらのデータセットが高品質で一貫性があり、関連付けられ、すぐに使えるデータであること、さらにそうしたデータをいち早く理解し重要な判断に使用できるようにする方法を見出すことです。

すぐに使えるデータは自動化を可能にする

データの爆発的な増加自体は、変化や複雑性をもたらす基本的な要因にすぎません。目前に迫った課題の規模を踏まえると、金融機関がデータ管理の改善に役立つプロセスを自動化し、アルファを創出するための技術に目を向けるのは当然と言えます。

機械学習はそうした技術の最前線に躍り出てきました。自然言語処理とデータ収集の進歩によって、電子化されたプラットフォーム全体にわたり取引の自動化が進んでいます。企業はビックデータと機械学習を活用することによって、顧客の需要や価格変動を予測しています。

バイサイドでは、ヘッジファンドや資産運用会社が予測分析機能等を利用して市場の流動性に基づくリスク評価を行っています。業務フローの自動化が進むにつれて、金融専門家の皆さまは戦略やポートフォリオの選択、投資テーマの策定などを含む人間の判断が必要な面に一段と重点を置くようになっています。また、新たな技術を活用し、より高度なインテリジェンスをトレーディングや顧客対応に関わる業務フローに組み込むことで、金融における数多くの問題を解決しようとしています。

ブルームバーグがアジア太平洋地域の4つの都市(シドニー、シンガポール、東京、ムンバイ)で開催した『Bloomberg Machine Learning Decoded』ロードショーでは、大半の金融専門家の皆さまが機械学習の活用を通じて、シグナルとファクター(要因)の構築や、トレーディング効率の向上に向けた執行戦略の最適化を図っていることが分かりました。これらの市場の中で、とりわけ日本はトレーディング・モデルにおける機械学習の活用という点で、他の3都市を大きく引き離しており、投資戦略では最も広範にわたるデータセットを活用しています。

こうした状況から、ブルームバーグは機械学習技術のポテンシャルの理解に向けた取り組みを加速させています。

データがサービスに

機械学習の時代には、金融データや情報は豊富になる一方、より予測的かつ系統的になるとみられます。当社は世界有数の金融情報企業として、「整理された形式」にデータを標準化しています。過去データが標準化されることによって効率性と相互参照能力が向上し、データ分析が容易になります。

ブルームバーグが新たに立ち上げたウェブベースのデータ配信プラットフォームである「ブルームバーグ・エンタープライズ・アクセス・ポイント(BEAP)」は、操作性に優れており、バルクデータセットの検索・活用、そしてモデル化・視覚化を容易に実現します。顧客はバルクデータセットを検索・活用することができます。このBEAPに先日、ブルームバーグやオルタナティブ・データの主要プロバイダーが提供する20以上の非従来型のオルタナティブ・データセットが追加されました。データセットには、金属在庫量に関する洞察、株式ブロガーのセンチメント、医薬品の承認、駐車場の混雑状況、建設認可、地政学リスク、アプリ活用状況といった情報があります。

また、顧客企業の皆さまはそれぞれが日常使用しているシステム上でデータを活用したいと考えています。そこで当社は時間や場所を問わずにデータを提供できる方法に取り組んでいます。データは間もなく一つのサービスとなり、プラットフォームは将来的に軽量化されモバイル性に優れたものになるでしょう。

機械学習は基本的にデータ駆動型であり、投資家が極めて複雑な関係を迅速に把握するのを支援することができます。そして、データにおける複雑な相互作用や問題、計算リソースや的確なデータの確保などが原因で、これまで扱いにくかった各種問題に対するアプローチを可能にします。

現在、利用可能な手法や技術はますます高度になっていますが、こうしたことや機械学習における戦略の成功を裏付けるのは、高品質で、関連付けられ、直ちに使用可能なデータの重要性の高まりです。機械学習の新時代においては、このことを現時点で理解し、データ駆動型の企業戦略を導入する企業が最終的な勝者となるでしょう。