まずは数理的思考を身に付けよ!

まずは数理的思考を身に付けよ!全大学が「AI教育」を競い合う時代に
https://newswitch.jp/p/22307

※ こういう人が、書いている記事だ…。

『ビジネスや行政などの意思決定の根拠となるデータを、数理的な思考でとらえて人工知能(AI)で分析する―。そんな数理、データサイエンス(DS)、AIの人材育成が急ピッチで進む。政府の「AI戦略2019」では初級レベルは全大学生に必須とされ、認定教育プログラム制度が進みだした。文部科学省のモデル構築事業も拠点6大学から協力校へと展開中だ。これらの教育に関わらずに済む大学は皆無、そんな時代に入っている。(取材=編集委員・山本佳世子)』
『政府が19年にまとめたAI戦略でイメージするのは、組織の活動やIoT(モノのインターネット)で得られるビッグデータ(大量データ)を、統計学やAIで分析して活用する人材だ。企業や官公庁、地域社会などあらゆる分野の課題解決でニーズが急増している。内閣府は象徴的な言葉としてAIを出しているが、教育テーマとしては論理的考え方やデータに基づく分析など広義のものだという。

同戦略では25年の目標を掲げ、大学生は学部によらず「全員が初級のリテラシー(読解記述力)レベルを学ぶ」とする。大規模な取り組みとなるため「数理・データサイエンス・AI教育プログラム認定制度」で後押しする。応用基礎レベルの整備は1年先に予定しているが、まず今年3月にリテラシーレベルを2本立てで整えた。

このうち「認定教育プログラム」は「全学での開講」「複数の専門分野の学生の履修」「履修の学生数や率を高める計画」などの要件を満たせば書類審査で済む。ただ申請プログラムで1年以上の活動実績が必要だ。「データサイエンス学部の実績を基に、全学展開を図る大学」などが対象と予想される。』
『もう一つ、一段上となるのが「認定教育プログラム+(プラス)」だ。他大学を先導する独自のプログラムで、認定には実地調査もある。「全学生の半数以上が履修しているか、3年以内に実現する計画」という部分のハードルが高い。内閣府の佐藤文一審議官は「旧帝大や研究型大学には、より先進的な取り組みで『プログラム+』にチャレンジしてほしい」と強調する。どこが先陣を切るのか、視線が集まることは間違いない。』
『文部科学省は17年度から、大学が文系理系を問わず全学的な数理・DS教育を後押しする事業を進めている。20年度は国立大学の運営費交付金の一部の10億円をこれに充てる。事業開始時は「数理・DS教育」としており、前面になかったAIも、今は内閣府の戦略と相まって扱う。

拠点校は北海道、東京、滋賀、京都、大阪、九州の6国立大学だ。数学、統計、情報など各大学の強みを出しながら、他大学の参考になる標準カリキュラムの策定に向けて、学内での実施に取り組む。』
『九州大学数理・データサイエンス教育研究センターは最初に、高年次学生・大学院生向け講座に取り組んだ。受講生の卒業・修士研究用のデータ解析プログラムを実装し、個別指導をしつつ理論の学びに誘導した。理論から実装に進む通常の積み上げ式とは、逆の学びにしたのが注目だ。

次いで低年次学生向け講座では、看護学や文学など意外な分野も含めた先輩の実例を紹介。その上で学科別に必要なデータ解析法の原理を解説し、学生のやる気を引き出した。

専門が多岐にわたる教員・研究者60人程度が参加する合宿勉強会もユニークだ。共同研究費を用意し、例えば数学、情報、病院の研究者が、病院内の治療方針や医薬品選定を合理的に決める手法の開発に取り組む。内田誠一センター長は「データ分析を串にして、考えられなかったつながりが生まれている」と効果を実感している。』
『一方、北海道大学の場合は「学部、修士、博士の各課程を想定した文科省のDSの3事業すべてで採択されている」(数理・データサイエンス教育研究センターの湧田雄基特任准教授)のが強みだ。またデータを持つ企業と北大の産学共同研究を基に、社会人教育を展開する特色もある。』
『19年度には6拠点大学に加えて計20の国立大を協力校に据え、さらに公私立大へも広げていく計画だ。他大学での実施には、新型コロナウイルス対応で導入が進んだオンライン授業と演習の組み合わせや、指導役の教員を育成するファカルティー・デベロップメント(FD)も重要だ。伝統と異なるさまざまな手法で浸透を図ることになりそうだ。』
『内閣府の総合科学技術・イノベーション会議(CSTI)などで議論してきたAI戦略のうち人材育成は、25年時点で実施する人数を示している。最も下の小中学生は情報通信技術(ICT)の端末を1人1台で扱う。年間、つまり1学年の全高校生約100万人で理数(理科と数学)の素養を強化する。右図のピラミッド構造で底辺を支える大学などの全学生約50万人は、数理・DS・AIの初級レベルを学ぶ。学部1、2年生が対象だ。ここまでがリテラシーレベルだ。』
『この上の応用基礎レベルは「各専門分野×AI」の教育だ。専門の学びをする学部3、4年生の半分、約25万人を想定する。目を引くのは理工系人材は半分程度にすぎず、保健系や人文・社会科学系での育成も重視されている点だ。ダブルメジャーとして「専門は経営学とDS」などと言えるだけの力を付け、実社会での活躍を最も期待される層だ。

その上のエキスパートレベルは大学院生などで、2000人とぐっと数が減る。研究者やその卵としてDS・AIを活用する。最上位のトップレベルは世界と戦うAI先端研究者などで、100人としている。』
『データ分析は多くの数値データから普遍的な真理を導くのが狙いだ。伝統的には統計学を使い、心理学や教育学の調査研究でも行われる。統計学は数学の仲間だ。世の中の現象を1次式で近似する多変量解析には、数学の線形代数が使われる。過去のまとめに適するが、変化の激しい未来の予測手法としては微妙なところだった。

一方、AIは多様なツールがあり、未来予測に適する面がある。その一つ、人気のディープラーニング(深層学習)は画像判断や機械翻訳、囲碁などで、その強さが一般社会でも実感されたことで注目が高まっている。

日刊工業新聞2020年5月18日』

社会人のためのデータサイエンス入門|総務省統計局
https://gacco.org/stat-japan/

※ 総務省でも、「無料のオンライン学習」をやってるぞ…。

※ むろん、「有料オンライン学習」の講座も、あまたある…。

データサイエンティストのスクール比較・おすすめ講座・コース7選
https://www.bigdata-navi.com/aidrops/1809/

データサイエンス独学の書籍、オンライン講座、ブログ50選
https://www.finereport.com/jp/analysis/site/

※ にわかにAIにスポットライトがあたり、どの企業でも「AIの活用を図れ!」とか、「AI使って、何かやれ!」とかいう号令が下されるようになった…。しかし、如何せん、そういう「AIが何であるのか」「AIで何かやれる」という「AI人材」なんか、どこにもいない…。いても、数が少なくて、「需要に供給が追いつかない」…。「AI人材」どころか、そもそも「データサイエンス」を分かっている人材(DS人材)すら、数が少ない…。そういうのが、現状だ…。

※ それで、「このままでは、日本企業は、生き残っていけない!」ということで、強力に「政府の尻を叩きにかかった」わけだな…。

※ そういうことで、オレも気にはかけて、若干の資料や画像の収集は、やっていた…。今、フォルダを見ると、どこのサイトからキャプチャしたのかの「データ」までは、保存していなかった…。

※ まあ、いいや…。貼ってしまおう…。出所は、よく分からん…、ネットのどっかに転がっていた…、ということで…。

※ 何か新しい分野にチャレンジしてみようと考える時は、
1、文献(紙の書籍、電子データの書籍)で、ざっと感じを掴む。
 導入本、初級本、中級本、上級本とあるので、まず「導入本」を2、3冊読んでみる。中には、「マンガで解説する○○」みたいなものもある…。
2、無料の「お試しオンライン学習」を、やってみる…。
3、大体の感じが把握できたら、いよいよ「有料オンライン学習」に取りかかる…。
 という段取りで取り組むのが、いいんじゃないか…。
 まあ、オレはいつも1で止まっているが…。それも、「導入本」2、3冊読んで「オシマイ」というのが多いな…。
 ネットは、玉石混交だ…。中には、「金取り」「詐欺まがい」も混じっている…。そういうものも、回避していかないとな…。

Udemyで400コース学んだ黒澤さんがおススメするデータサイエンスコース10選+α
https://zine.qiita.com/products/udemy-datascience/
『──具体的な事例ですごくイメージが沸きました。次に伺いたいのですが、黒澤さん自身、これまで学ばれてきて、データサイエンスにはそもそもどんな知識・スキルが必要だと考えていますか︖また、あわせてそのスキル習得に効果的だったUdemyコースも教えてください。

黒澤:データサイエンスに必要なスキルは大きく3つと考えています。

1)数学(微分、線形代数、統計など)
2)プログラミング(Python、R)
3)問題解決力(価値創造する力、論理的思考力など)

まず数学についてですが、僕の経験上からもこれがデータサイエンスの学習においては最も重要だと考えています。

というのも、自分自身、Udemyでデータサイエンスを学び始めたころ、数学を学ばなかったことで失敗しているからです。』
『──そうだったのですね。それはどんな失敗だったのですか?
黒澤:正直いうと、もともとプログラミングスキルには自信があったので、PythonやRもすぐに使いこなせて、データサイエンスもできるとおごりがありました。
しかし、実際は、Pythonが使えたとしても数学の理解がないとただチュートリアルを動かすだけしかできません。

僕は、データサイエンスを活用した課題解決において重要な「数値予測」か、「カテゴリー予測」かの判断が数学(統計)の知識がなくてできなかったんです。

例えば、手書き文字の画像認識をしたい場合は「カテゴリー予測」を使う。商品の売上シミュレーションをしたい場合は、「数値予測」を使うなど課題に応じて判断しなくてはいけないのですが、それができなかったんです。

数学を学ばずに、機械学習ライブラリを使った⾼度な分析を実⾏しても理解が浅く、チュートリアル以上の事をしようとすると途端に難しくなってしまいました。』
『──エンジニアリング力の素地がある方だからこそ陥ってしまう落とし穴なのかもしれませんね。ただ、「微分・線形代数」については、具体的になぜ必要なのかまだわからないのですが、補足いただけますか?

黒澤:微分や線形代数は、機械学習など関数を使った予測モデルの作成に必要になります。機械学習とは、プログラム(機械)にデータを学習させて、予測させることです。予測するためには、実測値と予測値の誤差を最⼩限にさせていくことが必要で、これを「最適化」と言い、微分を使います。

この「最適化」の計算・演算をするためには、画像やExcelで作られた表データなど、すべてのデータを行列の形で数値化する必要があります。この行列を計算するための手段として線形代数が必要になります。さらに、学習させたモデルの精度を確認するために統計が必要になるんです。』
『──なるほど、よく理解できました。では、黒澤さんも特に重要だという数学を学ぶのにおすすめのUdemyコースはありますか?

黒澤:「【キカガク流】人工知能・機械学習 脱ブラックボックス講座 – 初級編 -」と「【ゼロからおさらい】統計学の基礎」がおススメです。

「【キカガク流】人工知能・機械学習 脱ブラックボックス講座 – 初級編 -」は、板書のように手書きで順を追って説明してくれ、わかりやすく人工知能の仕組みと機械学習の実装に必要な数学(微分と線形代数)を学ぶことができます。さらに得た知識をもとにPythonを使って簡単な機械学習の実装までを4.5時間で経験できるので入門者にはおススメです。』
『「【ゼロからおさらい】統計学の基礎」は、統計の基礎が学べ、統計基礎の鬼門といえる「仮説検証」を中心に理解することができます。また、「アプリの同時起動数」をテーマに統計を使い、「どれだけのユーザーが同時にアプリを起動してもサーバーが落ちずに耐えられるか?」を予測する演習をエクセルを使って行います。』

 ※ 後半は、「宣伝くさい」が、重要なことを言っていると思われる…。こういう、「電子計算機」を使って「機械」に仕事をさせようとする場合、「数学」のある程度の理解は不可欠だ…。なぜなら、「電子計算機」は、しょせんは「計算・演算」しかできないからだ…。そういうものに、「人間の望むような仕事」をさせようとすれば、「数式を組んで」「代入する値(データ)」を与え、「計算・演算」させていくしかない…。それには、「数学」のある程度の知識が前提になってくる…。