MUFGのシンクタンクによる金融領域におけるビッグデータ活用の事例集。主に文章解析技術であるテキストマイニングを使った分析が紹介されています。具体例が多く、ビッグデータ分析のヒントを得られるかもしれません。

↑気になったらここからポチっと↑
市場情報を活用したAIによる株式運用は既に各社でサービス化されていますが、異なるAIであっても売買する条件・ロジックが似通っているとちょっとした市場の変化にAIトレーダーがいっせいに反応して株価の急騰や急落が起こるリスクも高いのです。
文章で書くととてもシンプルに見えますが、実際は名詞・動詞のポジティブ・ネガティブのデータ登録だったり、様々なモデルを組んだりと泥臭い作業が多いことが紹介されています。
一方で、銀行は個々の取引情報を把握できていないので、財務諸表のような定点のスナップショットや不動産を担保とした融資審査を伝統的に行ってきました。最近では倉庫にある在庫情報などを活用した動産担保融資(Asset Based Lending)が一般化してきましたが、ビッグデータという観点ではEDI(Electronic Data Interchange)を活用した商流の把握が有効なのだろうと思います。EDIとは、企業間で売掛債権・買掛債権を自動的に消しこむ仕組みのことで受注・発注データに付与され、標準的なフォーマットが規定されています。企業間の決済は銀行を経由するので、銀行がEDI情報をビッグデータ分析することで様々な情報を得ることができます。例えば、買掛債権の支払と売上債権の回収を比較することで顧客企業が好況か不況かが分かります。さらに、決済先との取引頻度・金額を把握することで企業間ネットワークを把握することができます。顧客企業が好況の場合、その取引先(例えばサプライヤー)にも資金調達ニーズがあると想定されるため、新たな顧客開拓が見込めたりします。
これまで解析されなかった有象無象のデータは宝の山かもしれないのです。
↓気になったらここからポチっと↓
↑気になったらここからポチっと↑
金融領域におけるビッグデータ分析のサンプル
株式運用
株式投資をやっている方には常識なのでしょうが、株価に影響する要素としてファンダメンタルズ・テクニカル・センチメント・アノマリーの4種類があります。ファンダメンタルズ
各種の経済基礎指標です。GDPなどのマクロ的なものから、企業や家計の経済状態のようなミクロな指標まで幅広いです。指標であるため、定量的でありビッグデータ分析に適しています。例えば、米国市場の前日終値と、日本市場の始値に0.7~0.8の相関(かなり強い関連性)が紹介されています。テクニカル
株に関連する指標です。株価の移動平均や、株価と売買高を組み合わせたRSI (Relative Strength Index)・VR (Volume Ratio)など目的に合わせて様々な指標があります。こちらも定量的なので分析に向いています。センチメント
投資家心理です。「皆が買っているから買おう」のような市場心理が株価に影響するケースであり、バブルはセンチメントによって引き起こされるのです。経済学的には、基礎情報であるファンダメンタルズが変わっていないのに、株価が急騰するのをバブルと呼ぶようです。アノマリー
株式取引にまつわる法則・経験則のようなものです。例えば、「売り時は5月(Sell in May)」という経験則について、実際のデータ・リターンはどうだったかの検証が行われています。市場情報を活用したAIによる株式運用は既に各社でサービス化されていますが、異なるAIであっても売買する条件・ロジックが似通っているとちょっとした市場の変化にAIトレーダーがいっせいに反応して株価の急騰や急落が起こるリスクも高いのです。
企業間ネットワーク
取引関係などで企業間のつながりを可視化しようという取り組みです。例えば、トヨタとデンソーのような取引関係が広く認知されている企業の株価は、お互いに強く関係します。一方で、認知度が低い企業間の株価はすぐに連動せずラグが生じ、取引関係の認知度が高まると徐々に連動していくことが示されています。ESG評価
ここ数年でメジャーになったESG経営(Environment(環境)・Social(社会)・Governance(企業統治)の頭文字)について、テキストマイニングを使った各社の本気度測定が紹介されています。具体的には各社のCSRレポートをインプットに、出てくる単語をツリー構造化したり、単語間の距離(共起性)をベクトル表現してみたり(関連性の高い単語ほどベクトル成分は近似する)する手法が紹介されています。テキストマイニングの具体的な活用事例として興味深いのです。決算短信評価
ESG評価で使ったテキストマイニングを決算短信の評価にも使ってみようという試みです。文中に使われている動詞(述語)がポジティブかネガティブかを判定します。ただし、「売上が増えた」はポジティブですが、「コストが増えた」はネガティブなので、動詞だけでなく名詞(主語)と組み合わせて評価するのがポイントなのです。決算短信の全文を評価し、総和としてポジティブなのかネガティブなのかを算出することでその企業が好況なのか不況なのかを判定します。文章で書くととてもシンプルに見えますが、実際は名詞・動詞のポジティブ・ネガティブのデータ登録だったり、様々なモデルを組んだりと泥臭い作業が多いことが紹介されています。
マクロ経済分析
33種類の経済指標を基に直近のGDP・インフレ率・政策金利を予測する「ナウキャスティングモデル」が紹介されています。独立性の高い指標を取り入れるほど予測精度は上がることが示されるなど、システム屋としてはとても興味深いのです。従来のマクロ経済分析は企業や家計などの様々な経済集団をひとくくりにし、ある経済政策が平均的な企業・家計に与える影響を評価していたのですが、ビッグデータを活用することで所得別の影響評価などより粒度の細かい単位での分析が簡単にできるようになってきたことが示されています。高頻度情報から読む取引行動
アマゾン・楽天のようなEコマース企業と銀行が持つ顧客情報における決定的な違いは、顧客企業の個々の取引情報を持っているか否かです。Eコマース企業は顧客企業の決済の代行をすることで、日々の売上など即時性の高いデータを大量に保有しています。そのため、顧客企業の取引状況を見て、トランザクションレンディングと呼ばれる迅速な資金提供を行うことができます。モノの流れ(商流)とお金の流れ(金流)を把握しているEコマース企業ならではのサービスです。一方で、銀行は個々の取引情報を把握できていないので、財務諸表のような定点のスナップショットや不動産を担保とした融資審査を伝統的に行ってきました。最近では倉庫にある在庫情報などを活用した動産担保融資(Asset Based Lending)が一般化してきましたが、ビッグデータという観点ではEDI(Electronic Data Interchange)を活用した商流の把握が有効なのだろうと思います。EDIとは、企業間で売掛債権・買掛債権を自動的に消しこむ仕組みのことで受注・発注データに付与され、標準的なフォーマットが規定されています。企業間の決済は銀行を経由するので、銀行がEDI情報をビッグデータ分析することで様々な情報を得ることができます。例えば、買掛債権の支払と売上債権の回収を比較することで顧客企業が好況か不況かが分かります。さらに、決済先との取引頻度・金額を把握することで企業間ネットワークを把握することができます。顧客企業が好況の場合、その取引先(例えばサプライヤー)にも資金調達ニーズがあると想定されるため、新たな顧客開拓が見込めたりします。
これまで解析されなかった有象無象のデータは宝の山かもしれないのです。
↓気になったらここからポチっと↓