導入事例産学連携でナレッジ蓄積と人材育成推進
本来の「データサイエンス」確立へ
一橋大学大学院経営管理研究科
企業戦略・経営財務プログラム
横内大介氏
- ご利用中の製品
- QUICK Workstation
社会人大学院の一橋大学大学院経営管理研究科企業戦略・経営財務プログラムは2010年から、金融情報分析サービス「QUICK Workstation(AstraMパッケージ)」(以下QWS)を導入しています。データサイエンティストである同プログラムの横内大介准教授は、現在のデータサイエンスの在り方に強い危機意識を持っているそうです。その解決にQUICKとQWSがどのように役立っているかについて、横内准教授に聞きました。
導入の効果とポイント
- 研究に利用するデータの豊富さとクオリティ
- 学生でも使いやすいデータと操作性
- データ人材育てるサポートプログラムの充実
Q.データサイエンス研究の現状と課題について教えてください。
私の研究テーマは「データサイエンス」ですが、このデータサイエンスという言葉の意味がいま、誤解されている感があります。一般には、ビジネスアナリティクスやディープラーニングなどを指すケースが多いようですが、これは「データエンジニアリング」。さまざまなデータからデータに潜むニッチな関係を探り出す技術のことです。
サイエンスは「なぜ?」を見つける学問です。データサイエンスでいえば、なぜこのデータが発生したのかというメカニズムを見つけること。一方のエンジニアリングは実用に供することを目的にします。メカニズムは特に問われず、できたものが世の中の役に立つことが重要なわけです。
僕は「データに語らせる」のが本来のデータサイエンスだと考えています。生データを収集し、加工・浄化(クレンジング)して使える格好にしたうえでデータの裏側にある真実を見つける(=探索的データ解析)。それを統計モデルにすることでAIエンジンになる。そこで初めて新しい価値を生み出すわけです。失敗すれば、またデータに戻って解析すればいい。これが本来のデータサイエンスの考察プロセスといえます。
現在はデータのクレンジングや解析を飛ばし、機械学習させてAIをつくればデータサイエンスだという風潮が目立ちます。「なぜ、その答えが出たのか?」という問いに対しては、「わかりませんが、AIがこういう結果を出したのです」で終わり。AIが神格化されてしまっている。このような現状を僕たちは非常に危惧しています。
本来のデータサイエンスにおける考察プロセス
Q.QWSはどのように使っているのでしょうか。
昨今、注目を集めているオルタナティブデータ。その利活用を拡大させるためには、「なぜ?」の考察結果を事例として積み上げることが急務です。まずは「使えるデータ」とは何なのか、その定義が必要でしょう。そこは産学連携で進めると効率的です。例えば、データサンプルを我々に使わせてもらえれば、分析結果が修士論文でオープンになります。それを上手に使えばいい。
当研究科の金融戦略・経営財務プログラムは社会人大学院で、1学年の定員(修士)は41人です。学生の勤務先はアセットマネジメント(資産運用会社)など金融関連が半分、事業会社が半分でしょうか。ファイナンスを通した企業判断や企業経営を追求したいというスペシャリスト志向の学生が多いのですが、私のゼミの志望者は「オルタナティブデータがやりたい」という学生がほとんどです。
導入しているQWSは、主に学生に使ってもらっています。うちに来て初めて使ったという学生が多いようですが、感想を聞くと、職場にある外資系の同様サービスよりも使いやすいという声をよく聞きます。指導教員の立場から見ると、学生の理解度が早いですね。日本語サービスのメリットはとても大きいと感じました。いちど使ってもらいさえすれば、利用者は広がるのではないでしょうか。
私のゼミのアセットマネジメントの学生の研究テーマはプライシングモデル関連が多いですね。基本的な研究対象は株価=企業価値評価です。QUICKのニュースとQWSのデータを引っ張り出して、ニュースが出た夜の株価や翌日の寄り付きの株価形成にどう影響しているのか考察します。ニュースとは主に、QWSに流れているQUICK企業価値研究所の企業スコアやアナリスト予想値(QUICKコンセンサス)など。それなりに傾向があることがわかり、早い段階でいろいろな情報を得ることができそうです。
Q.今後の展望とQUICKに期待することを教えてください。
今後進めたいことは大きく2つあります。1つめは、オルタナティブデータの利活用推進で、そのための産学連携組織である「一般社団法人ADSリサーチアソシエーション」を主宰しています。ここでの事例を増やしていきたいですね。
2つめは少し大きな視点で、データ分析の「質」を確保することです。これだけデータ分析が流行っている昨今、その分析が正しく行われたのか、誰も確かめることができません。それを解決する仕掛けをつくっていきたい。
例えば、スタートとして生データのスナップショットを取る。そのデータを誰かが使うと、どのような加工が行われたのか自動的にロギング(情報を時系列に記録・蓄積)していく。最終的にどのような分析をしたか、どのモデルを使ったか、トータルに「監査」ができるような仕掛けです。結果として、分析の正誤もわかるし、不正も見つけることができます。
そのためには、データを集める際の共通フォーマットが必要になるでしょう。フォーマットされたデータからどのように変容していったのかを記録するわけです。分析結果を抱き合わせて、データと分析結果をパッケージした形で世の中に流通させます。これができれば、データだけ配ってユーザーが「何をしたらよいかわからない」ということは少なくなくなるでしょう。
QUICKとはQWSの利用を通じて、共同でセミナーを開いたり端末の活用講座を提供いただいたりしていて、オルタナティブデータの利活用を進めたいという共通認識があります。データを使える人材をつくらないと、(QUICKは)データを買ってもらえませんし、一方の僕たちもデータ人材を育てたい。
今後もコラボレーションしながら、オルタナティブデータをはじめとしたデータ人材の育成とデータ利活用の新しい枠組みづくりを進めていきたいと考えています。
皆さまのニーズに合わせたソリューションをご提案します。
まずはお問い合わせください。