ブルームバーグ、TOMSにNLP機能を新規追加

Read the English version published on August 24, 2020.

この記事は、WatersTechnology のRebecca Natale が執筆し、ブルームバーグのライセンスを受けています。

テクノロジー企業にとっての永遠の課題は、顧客からの日々のニーズに応える一方で、長期的な視点でディスラプション(破壊的イノベーション)に備えることです。この課題に対応するため、ブルームバーグのセルサイド向けソリューション事業では、少数のエンジニアから成るチームを組成し、必ずしも足元の顧客ニーズに応えるものではなくても、数年後のニーズを予測したソリューションの構築を専門業務として取り組ませました。これらは今後テクノロジーの民主化が進み、規制が課され、世界がますます複雑化する環境の中で必要になると予想されるソリューションです。同時に、これはデータとテクノロジーの大手であるブルームバーグが、 最先端テクノロジーを有するスタートアップ企業に後れを取らないための将来を見据えた取り組みともいえます。

このチームによる、テクノロジーの最先端に居続けるための取り組みの1つに、同チームが開発した新しい検索機能があります。この機能は、ブルームバーグのトレードオーダー・マネジメント・ソリューション(TOMS)の取引分析機能に組み込まれています。

この新機能はQ&Aインターフェースであり、その核として自然言語処理(NLP)と機械学習アルゴリズムをフル活用したエンジンを搭載することで、トレーダーの個々のニーズを反映した質問に対し回答を出します。この機能は、あるデータセットそのものを検索する際、もしくはあるデータセット内を検索する際に必要なクリック数を減らすことを目的としており、例えばバイサイド顧客との取引履歴の照会や、一定時間内に約定に至らなかった取引の特定などが、検索例として挙げられます、とブルームバーグのセルサイド・アナリティクスの責任者Robert Simek はWatersTechnology に語っています。

このような手間のかかる検索では、通常は取引ブロッターにアクセスし、列の追加や削除、日付範囲の変更、異なるフィルターの適用など、多くのマニュアル作業が必要となります。もしくは、顧客はデータを単純にエクスポートしたり、デスクの同僚に求めていた回答をまとめたリポートの作成を依頼することもあるかもしれません。

その結果、トレーダーが本来簡単な質問にもかかわらず回答を得るのに何時間、もしくは何日もかかる可能性があります。

NLPモデルは、標準的な人間の言葉を理解するために多くのトレーニング時間とデータを必要とします。簡単な例を挙げると、「August」という単語の意味を変えないで、つづり方、省略形を学習させます。これと同じように、このチームでは金融領域に特化したフレーズをNLPモデルが理解するのに十分な時間をトレーニングに費やしました。

「業界で使用される専門用語があります。例えば、『completed trade(約定取引)』はどういう意味ですか?『done trade(約定取引)』はどういう意味ですか?『missed trade(未約定取引)』はどういう意味ですか?」Simekは、「トレーダーやフロントオフィスのユーザーは、質問を入力して間違った回答を得た途端、2度と使用しないと思うでしょう。非常に高い正確性と理解度が、このプロダクトに必要とされています」とコメントしています。

構想から完全なプロダクションのリリースまで、このプロジェクトの開発期間は約1年に及びました。Simekは、このQ&A形式はあくまで土台にすぎないと強調します。なぜなら、顧客はプラットフォームAとプラットフォームBの取引回数を比較したいなど、より分析的なタイプの質問をするためのインターフェースの使用を望んでいるからです。

この要望を満たすことが、次に同チームが取り組むプロジェクトになります。機械学習モデルは時間をかけて学習するもので、まず質問パターンの理解から始まります。これらの質問には、最新トレンドやランキング上位の債券に関するものから、複数のデータベースから集計作業を行って回答を導き出す必要のあるトピックに関するものがあります。今日、従来のツールが使用しているデータベース構造では、より分析的な質問に回答するにはあまりにも時間がかかりすぎます。

Simekは、(当戦略における)今後の取り組みの1つはデータをより近代的なデータベース構造に移行し、より複雑なクエリでも瞬時に回答が得られるようすることだと述べています。従来のリレーショナルデータベースでは、単一の値、例えばトランザクションIDにインデックスが付与されます。例えばトレーダーがデータベース内の別の列で、特定セクター内のカウンターパーティーを調べたい場合、「テクノロジーセクターでわが社のトップ5アカウントは?」と質問します。すると検索エンジンは、すべてのレコードをスキャンし全カウンターパーティを特定し、グループ化してから合計する必要があります。「そのために時間がかかりすぎるのです。これはExcelのグリッドと似ています」とSimekは説明しています。この問題を解決するために、非リレーショナルデータベースを使用できます。データセットに含まれるあらゆるデータポイントをグループ化し、すべてのデータをスキャンするよりもはるかに早くデータを利用できるようになります。

今日では、一般消費者やトレーダーはモバイル機器で Google のような検索エンジンを使用して簡単に質問の回答を見つけ出せるだけでなく、特に自分自身に関係するデータにアクセスすることさえできます。アプリの相互運用性が高まる中、携帯電話でリアルタイムの情報、例えば、個人の健康状態や日々の身体活動に関連する情報を得ることが可能となりました。

企業においては、トレーダーは日常使用するツールに組み込まれているような機能を、取引ツールでも使用したいとますます望むようになっています。Simekによると、企業向けソフトウエアは従来よりウォーターフォール型開発プロセスで構築され、ソフトウエアは具体的に書かれた作業指示書に従います。一方で企業向けソリューションのベンダー各社は、機械学習や高度なNLPモデルなどの最先端テクノロジーの実装に対応できるようテクノロジー面の能力をますます高めています。エンドユーザーと連携することで、採用率は「イノベーションの普及曲線」と容易に一致し、さらにはそれを上回ることができると Simek は述べます。

「今日、この2つ(消費者向けテクノロジーとトレーディング向けテクノロジー)の間のギャップはかなり大きいと考えています。通勤電車内では、スマホに搭載されてる最新テクノロジーで欲しい情報を検索して探し出せる一方で、職場に到着し業務を始めると、使用するソフトウエアは完全には最新テクノロジーを活用できていないわけです。理由はいろいろあります。ただこのギャップに変化が見られるようになれば、多くの人はとてもワクワクすることでしょう」Simekは語っています。