非線形回帰するぞ。一般化加法モデルまでの道

近頃都に流行るもの、AI、その技術の進歩によりAIが人間の知性に追いつき、あと数十年でホワイトカラーの仕事は機械に置き換えてしまうらしいです。
Googleが、Teslaが、IBMが、nVidiaが、最先端のテクノロジー企業がこぞってAIの開発に全力を尽くしているんだとか。
ところでAIという言葉は具体的に何を指しているのでしょうか?
私の中では機械学習ソフトウェアもしくはそれがインストールされているハードウェアがそう呼ばれているのだということになっています。
では機械学習とは何か?

厳密な定義は知らずとも、実は世のビジネスマンのほとんどが機械学習を使った経験を持っています。
それは回帰分析です。
あなたがエクセルで『分析ツール』から『回帰分析』を行うとき、あなたは学習機を作って分析させ、その機械をポイと使い捨てにしています。
我々は使い捨てられる前にみんなで機械のゴミの山を築いているのです。ザマミロ!

これが嘘だと思うなら『機械学習』と名のつく教科書を一冊手にとって開いてみてください。
そこには一番初めに『線形回帰』の章が置かれているはずです。
(例:この業界で最も幅をきかせている教科書の一つ

ざっくり言うと、機械学習とはすでに得られたデータを使ってシステムを調整し、その調整されたシステムに新しく得られたデータを入れたときに答えを返してくれる、という仕組みのことです。
調整、これをこの分野では学習と呼びます、のステップと予測のステップの2段階に分割されているところが特徴です。
この定義で考えれば線形回帰も機械学習であることが分かりますね。

線形回帰はデータの集合に直線をピーっと引くだけなので、ぶっちゃけ人間にもできそうだしAI感が無いと思うかもしれません。
しかし直線でなくニョロニョロと曲線を引くとなったら、それは人間には中々難しいレベルの仕事に感じます。
これが非線形回帰と呼ばれる機械学習の手法です。

もしそれを使いこなせたら、そのときはAI感を感じられるかもしれませんし、さらに同僚や上司にも

「オレはAIを乗りこなしている!」

と威張ってみることもできるでしょう。

前置きが長くなりましたが、そもそも非線形回帰をやる動機としては、Prophetが統計モデルとして一般化加法モデル(Generalized Additive Model)というものを用いているため、これを正しく理解したいと思ったことです。
しかし勉強していてこれは一つの記事に収まるような内容ではないということが分かってきたため、いくつかに分割して連載という形にします。

流れはGareth James, Daniela Witten, Trevor Hastie and Robert Tibshiraniによる教科書An Introduction to Statistical Learning with applications in Rの第7章Moving Beyond Linearityを下敷きにして

  1. 多項式回帰
  2. スプライン
  3. 一般化加法モデル

と進めます。

いつの日か我々の仕事がAIに置き換わり人間は芸術的な活動に専念できる時代に到達できるように、技術の進歩に貢献できる記事を書いていきたいです。

関連記事(非線形回帰)

参考文献

コメントを残す