定量的知能（Quantitative Intelligence） ―　伝統的手法とAIを活用した運用手法の融合を図る

Article Body Text

人工知能（AI）、機械学習（ML）、深層学習（DL）の3つの用語は、しばしば、同義語として使われますが、コンピューター・サイエンスの分野では、それぞれが異なる概念を表します。3つの用語の違いを理解することは、それぞれの進化の歴史と可能性の把握に極めて重要です。

人工知能（AI）は、通常、人間の知能を必要とするタスクを実行できる様々なコンピューター・システムの開発を含む広義の用語です。また、機械が、感じる、論理的に考える、学ぶ、判断する等、人間が持つ能力を模倣することを目標にしています。人工知能は、知的な行動を実現するための機械学習や深層学習等、様々な技術を含んでいるのです。

機械学習は、コンピューターが明示的にプログラムされることなく、データから学習し、改善することを可能にするアルゴリズムや統計モデルに焦点を当てた人工知能の一部分です。機械学習のアルゴリズムは、データのパターンを分析し解釈することで、コンピューター・システムが、学んだ知識に基づいて予測し行動することを可能にします。人間の介在なしに独力で経験に適応し、向上する能力は機械学習の重要な特徴です。

深層学習は、特殊な形態の機械学習であり、人間の脳の神経回路網の構造と機能に着想を得たものです。深層学習は、複数の層を持つ人工の神経回路網、特に、深層神経回路網を使用して大量のデータを処理し、学習するためのものです。深層学習のアルゴリズムは、複雑なパターンを認識し、精度の高い抽象概念を抽出することに優れており、画像および音声認識、自然言語処理、自律走行等のタスクの遂行を可能にします。

機械学習と深層学習の主な違いは、使用される神経回路網の複雑度と深さにあります。従来型の機械学習のアルゴリズムは、手作業で設計された特性に頼ることが多いのに対し、深層学習のアルゴリズムは、相互に接続された複数層のノード^１を活用して、データの階層表示を独力で学習することを可能にします。こうした階層的アプローチによって、深層学習モデルは複雑な関係を認識し、データからより微妙な洞察を抽出することが可能なのです。

更に、深層学習のアルゴリズムは、通常、非常に高いコンピューターの処理能力と大規模なラベル付きデータセットを必要としますが、様々な領域で目覚ましい成果をあげており、画像分類、言語翻訳、ゲーム等の分野で、過去の水準を凌駕しています。

つまり、人工知能は知的システムの構築に焦点を当てた包括的な分野で、機械学習は、機械がデータから学習することを可能にするためのアルゴリズムを使う人工知能の一部分です。一方、深層学習は、深層神経回路網を使って、データから複雑なパターンや表現を抽出するための特殊な形態の機械学習です。いずれの技術も急速な進化を続けており、ヘルスケア、金融、交通・運輸、娯楽等、様々な産業を大きく変える可能性を秘めています。

機械学習（ML）　

機械学習は、様々な分野で私達の生活の一部となり、日々の暮らしに浸透した、目に見えない力となっています。

オンライン・プラットフォーム：

Netflix（ネットフリックス）、Amazon（アマゾン）、YouTube（ユーチューブ）のようなプラットフォームでは、機械学習のアルゴリズムが個人の嗜好や行動に基づいたコンテンツを提案することで、パーソナライズされたリコメンデーション（推奨）を提供します。

言語学習アプリ：

機械学習は、ユーザーの学習進度に合わせた練習問題や評価（フィードバック）を提供し、言語学習アプリの学習体験を個別化します。

教育用ソフトウェア：

機械学習は、教育ソフトウェアを使う学生の成績データを分析し、成績があがった分野を特定する他、個々の学生に見合った推奨あるいは適応学習の経路を提供します。

個別指導システム：

機械学習を使い、学生の勉強法、ならびに、強みや弱みに合わせて、的を絞ったフィードバックや助言を与えることで、個別指導を行います。

オンライン学習（eラーニング）プラットフォーム：

機械学習アルゴリズムは、eラーニング・プラットフォーム上のユーザーのインタラクションやエンゲージメントのパターンを分析し、コース内容の配信を最適化すると同時に、効果的な教授法を特定します。

言語翻訳ツール：

機械学習モデルは、大量の多言語テキスト・データから学習し、Google（グーグル）翻訳のようなツールの言語翻訳精度を向上させます。

このような日常の環境において、機械学習は教師として機能し、ユーザーのために個別化した助言、推奨、フィードバック等を提供することで、学習体験の向上に寄与します。

現代AIの短い歴史　

機械学習は、英国の数学者で暗号研究者であり、計算機科学者でもあったアラン・チューリング（Alan Turing）による1950年代の画期的な研究に始まる、数十年の歴史を有しています。チューリングは、データから学習することが出来る「普遍的な機械（universal machine）」という概念を提唱し、AIの基礎を築きました。最もその後は、計算能力の限界が露呈し実用面での応用が十分になされなかったことから、AI研究への関心が薄れ、資金不足に陥った1970年代の「AIの冬の時代」が訪れ、機械学習は様々な試練に見舞われました。

機械学習の研究は、計算能力の向上と大量のデータセットが利用可能となった1990年代後半から2000年代初めの時期にかけて再開され、トレーニング・アルゴリズムを加速させる並列演算処理能力を提供したGPUが重要な役割を果たしました。また、エヌビディアが2006年に開発したCUDA がGPUの機械学習計算の速度と効率性を更に改善しました。

機械学習の発展の歴史上、もう一つの節目となったのは、2017年に開発された深層学習アーキテクチャーであるトランスフォーマーの登場です。トランスフォーマーは、文章や文書等の連続したデータの効率的な処理を可能にすることで、自然言語処理タスクを飛躍させ、これをきっかけにGPTモデルの開発につながる道が開かれました。

オープンAIがGPTを開発したことは、機械学習の発展の歴史上、極めて重要な節目となりました。GPTモデルは、大量のテキスト・データを使い、トランスフォーマーと大規模な事前学習の力を活用して、人間が書いたようなテキストを生成し、言語に関連する広範囲のタスクを実行します。2020年に発表されたGPT-3は、自然言語処理能力の飛躍的な発展を示すものであり、人間の言語の理解と生成を目指す機械学習の可能性を示しています。

機械学習の発展の歴史には、チューリングの基本概念、「AIの冬の時代」に直面した課題、CUDAとGPUの高速化を伴った機械学習研究の再開、トランスフォーマーとGPTモデルの多大な影響等が含まれます。こうした進化が機械学習を新たな高みに押し上げ、様々な分野での応用を可能にすることで、現代世界を形成し続けるインテリジェント・システムの発展を促しています。

パラメーター空間（パラメタリゼーション）における爆発的な複雑性

機械学習の劇的な進化は科学や社会に大きな影響を及ぼしてきましたが、技術に対する私達の理解が、進化のスピードに追い付いているとはいえません。機械学習の基本概念の一つである「バイアスとバリアンス（偏りと分散）のトレードオフ」は、現在使われている機械学習の手法とは矛盾しているように思われます。

バイアスとバリアンスのトレードオフは、モデルに学習不足と（学習データに適合し過ぎて、未知のデータに適合できない）過学習の均衡を見つける必要があることを示唆しています。データの根底にあるパターンを捉えるには十分に複雑で、ランダム・パターン適合を回避するには十分にシンプルでなければならないからです。

ところが、実際には、極めて複雑な神経回路網等のモデルが、データに完全に適合する、あるいは、データを補間するように訓練されています。従来、こうしたモデルは、学習し過ぎであるとみなされることが多かったものの、テストデータには、しばしば、高い精度をあげていることが示されています。こうした矛盾が機械学習の数学的な基礎とその応用の妥当性に疑問を投げかけています。

カリフォルニア大学サンディエゴ校のミハイル・ベルキン（Mikhail Belkin）教授は共同執筆した論文の中で、従来の見解と現代の実践を整合させる二重降下曲線（Double Descent Curve）と呼ばれるパフォーマンス曲線について言及しています。この曲線は、補間点を超えてモデルの容量を増やすと、実際にパフォーマンスが改善すること示しており、従来からある、U字型のバイアスとバリアンスのトレードオフ曲線を含みます。著者達は、様々なモデルやデータセットに二重降下現象が広く存在することの根拠を示し、その出現を説明するためのメカニズムを提案しています。

論文で概説するモデルの性能と構造の関係は、古典的な分析の限界を露呈し、機械学習の理論と実践の両方に影響します。また、バイアスとバリアンスのトレードオフに関する従来の見解を超えて、極めて複雑なモデルの可能性を探ることが、パフォーマンスの改善につながり得ることを示唆しています。このような発見は、従来型の見解に挑戦し、機械学習の研究と応用の分野に新たな道を開くものと考えます。

定量的株式選択モデルが進化する機会

AIは、古典的なクオンツ（定量）分析アプローチの延長線上に、資産運用に応用可能なクオンツ（Quant）2.0アプローチを生み出しつつあります。伝統的な手法とAIを取り入れた手法は、補完性と明確な相違の両方を示しています。伝統的なクオンツ分析は、リターンの体系的な側面に焦点を当てることが多く、数十年にわたる長期プレミアムの分析を必要とします。こうした手法は経済要因に依存し、主に複数の要因に対するベータ値^２等の線形関係に着目します。また、先験的に妥当だと思われる、厳選した少数の要因を組み込むことが多く、そのパフォーマンスは経済情勢との密接な関係を示します。

一方、クオンツ 2.0アプローチは、複雑なモデルに適合するために大量の独立したデータに依存します。また、高頻度のアノマリー³を特定するために、代替データソースと強力なコンピューターの処理能力を活用しています。こうした手法は、モデルの非線形性に価値を見出し、現れたり消えたりする不安定なアノマリーを活用するため、モデルの適応が必要となります。更に、クオンツ 2.0はパフォーマンスの説明に、伝統的な定量手法とは異なる手法を用います。

伝統的なクオンツ手法が、長期的な体系的パターンと線形関係を重視するのに対して、クオンツ 2.0は、広範囲かつ大量のデータや非線形モデルを活用して、変化するアノマリーに適応します。クオンツ 2.0の登場は、データの入手可能性や計算能力の進化ならびに機動性と適応性に富んだモデリング手法への転換を反映しています。

伝統的なクオンツ手法と、AIを駆使した革新的なクオンツ 2.0の相違点を活かした運用は、二つの手法の補完性から恩恵を受けることが可能だと考えます。

[1] ネットワーク内の各デバイスや接続点。

[2] 市場全体との連動度合いを表す値。

[3] 通常のパターンや期待される法則から外れた異常な現象やデータ。

Share

機械学習（ML）

オンライン・プラットフォーム：

言語学習アプリ：

教育用ソフトウェア：

個別指導システム：

オンライン学習（eラーニング）プラットフォーム：

言語翻訳ツール：

現代AIの短い歴史

パラメーター空間（パラメタリゼーション）における爆発的な複雑性

定量的株式選択モデルが進化する機会

当資料をご利用にあたっての注意事項等

手数料およびリスクについてはこちら

関連記事

ヘッジファンドが輝く時

再生可能天然ガス：ごみを低炭素エネルギーに変える

金価格、過去最高値更新とその先

投資家の注目が戻りつつあるマレーシア株式市場

新興国経済は投資家が思っている以上に強靭である

避難先としての社債