智慧と知識とシンギュラリティ

 「智慧はコピーされることがない」という言葉に出会いました。
~「ソニーから学んだ「差別化戦略」 養うべきは知識ではなく智慧」茶谷公之氏

 智慧とは「真理を見極める認識力」であり、Wikipediaによれば「一切の現象や、現象の背後にある道理を見きわめる心作用を意味する仏教用語」とあります。いやこれは確かに容易に伝達できそうにはありません。 

 一方、知識はコピーし伝達できる。法則化され原理が明確になったものが「知識」なので伝わりやすいのですね。

 単なる知識でなく智慧が生んだイノベーションの差は決定的であり、それぞれの分野で経験を積んで智慧を養おうという氏の説に大いに納得しました。

 

 少し考えてみると、AIに「知識処理」はあっても、「智慧処理」はありません。そもそも智慧処理という語感からしてなんか異な感じがします。処理対象として、知識はあっても智慧は無いということは万人共通の感覚ではないでしょうか。

 また逆に、「知恵の輪」はあっても、「知識の輪」はありません。知恵の輪は知識では解けません。つまり智慧には、「試行錯誤」が深く関わっているようです。

 知識は処理できる対象であることから、よりエレガントに整理され、ますます伝達されやすくなるのでしょう。数学の証明がまさにその例です。

 若い頃憧れた広中平祐氏。氏のフィールズ賞受賞業績である「特異点解消定理」※1。世紀の難問をいわば力業でねじ伏せた証明は218ページとか。当時の数学史上最長論文で「広中の電話帳」として有名なくらいです。理解できる人は世界に10人と、よく言われる表現で語られました。

 その後、証明は洗練されて、今では「大学院初年級の学生でも“ごまかしなし”に全体が読める証明がある程に理解が進んでいる.」(松木謙二, 数学69巻1号2017年1月)といいます。さらに、智慧の結晶である数学理論が、知識化のおかげで、今では機械学習モデルを支える定理として、実世界の課題に対して具体的な解決をもたらしているそうです。

 智慧は各所に大なり小なり必要であり、知識の体系化も様々な応用も智慧があればこそといえるでしょう。しかしなんといっても最初の着想と筋道の発見こそが、人類の智慧の集積点であり、そう、まさに特異点に違いありません。※2

 智慧はコピーもできないし、微分もできない、ということが導かれました(笑)

 

※1 任意の代数的集合(「多項式=0」で定義された集合)は,ブローアップと言われる操作を繰り返すことで 必ず特異点を解消することができる(広中の定理)。

特異点とは、微分不可能な点。ジェットコースターの影(2次元への射影)が交わっているところ、これが特異点で、実際の3次元空間で交わっていたとしたら大事故になります。

つまり次元をあげる・見方を変える、ことで特異点が解消される、という、ある意味、仏教の悟り的であり、まさに本来の意味での「智慧」がもたらしたもの、日本人が解くべきして解いた定理だったように思えます。(広中平祐, 「生きること学ぶこと」にも確かそんなようなことが書かれていて心が震えたものでした。)
最初の論文が出てから50余年の時を経て、機械学習の統計モデルにおいてこの定理が極めて重要な役割を果たしているというのは何ともロマンチックな話です。

※2 それとは別にこの「特異点」という語は、近年、特にAI文脈で特別な意味をもって取り上げられますね。いわく、2045年にシンギュラリティが訪れる!と。(技術的特異点:AI自ら人間より賢い知能を生み出す事が可能になる時点

「MLモデルはデータのViewでしかない」或いは深層学習の限界の証明

DeepMind社のリサーチャーJacob Menick 氏は「MLモデルはデータのViewでしかない」とつぶやかれています。

https://twitter.com/jacobmenick/status/1260658763687538688

これは実に真理をついていると思います。

MLモデルが y=f(x)のf と言えるならば、このf がデータのViewだと言ってるわけですね。例えば、このf (x)を

としたらいかがでしょうか? そう相加平均。こんな単純な、と思ってもこれもデータ全体を表現したひとつのViewです。つまり入出力データをモデル化するということは、「入力データの、ある目的に沿った抽象化」ととらえられます。

予測モデルでは、ある未来予測という目的に沿ってログデータを活用した抽象化だといえます。ここで目的は暗に、x に対するy という形で与えられます。

元データにすべて入っている情報を料理するのが機械学習であり、それ以外に素材としては何も使っていないわけです。

となると、元データに目的を解くカギが過不足なく入っているのか? が問題となるわけです。そしてその意味では、画像認識はまさにこの条件を満たす理想のデータ(全ピクセルのRGB値)が対象であり、このことこそが深層学習が極限までワークする理由でもあります。音声認識も然り。

一方で、人の行動予測や株価の予測はどうでしょうか?

ここでは要素還元の限界を容易にみることができます。元データ特徴量にどこまで追加しても、ことの原因をすべて入れることはできません。複雑系に対して要素還元主義は無力です。

このように、深層学習が万能でないことが証明されました。

RSS
Follow by Email