人工知能ってどう学習するんだ?って年配の研究者に聞かれたら? part2

Tech-potのサイエンスカフェに参加してきたら?
って送り出してあげましょう。
私のような、年配の化学・薬学系の研究者は、亀の子はわかるけど、数学や統計は大嫌いな事が多いです。
65どころか70,75まで働かされてもAIに仕事取られるだけ?
リスキルって言われても。。。。

横幅が狭いので、こちらのページで見てもらう方が良いかもです。

新型コロナが出た時に、お茶のカテキンがウイルスを無毒化するという話がありました。
細かいことは省略しますが、ハーブや食品中に入っているような化合物とコロナのスパイク部分がどのくらい強く結合するかを人工知能に教えてみましょう。
(結合の強さは、文献に与えられているとします)


プログラムで、まず、Stepのボタンを押します。
最初の化合物はEGCG(エピガロカテキンガレート)です。それをニューラルネットワークに放り込むと、計算値、2.91が返ってきます。正しい答えは7.57なので、値が”小さいよ”って人工知能に教えてあげます。Lowボタンを押します。
するとニューラルネットワークが少し調整されて、計算値が少し大きくなります。
この調整というのはニューロン同士の結合荷重の増減で行います。
イメージ的には、ニューロン同士を繋ぐシナプスがどんどん太くなり情報が流れやすくなります。

次にStepを押すと次の化合物クルクミンが現れます。これも計算値が小さいのでLowボタンを押します。

そうやって、繰り返し、飽きもせずに教えていくと、AIはだんだん正しい答えを返すようになります。ここでは18化合物を繰り返します。

データ・サイエンティストなんて偉そうですが、やっていることは、LowとHighのボタンをひたすら押しているだけです。
でも、そんなのは機械に任せればいいですよね。Autoボタンを押すと20000回繰り返します。Autoを何回か押したら、Checkボタンを押してみましょう。
化合物の計算値と正しい答えが表示されますが、かなり近い値を返してくれることがわかります。これがAIによる学習です。

今回はコロナのスパイクとハーブ類のBinding energyを教えましたが、毒性だとか、アレルギーの度合いだとか、数字であらわされるものは、やり方は皆同じ。大きいか小さいかを、繰り返しても飽きもしないAIに学ばせれば良いだけです。
所詮、コンピュータなんて数字しか理解できないのですから。

大事な点は、そのことを一番よくわかっている研究者がボタンを押そうが、小学生が押そうが、結果は同じということです。

経験を積んだ研究者が、自分の付加価値をアピールしたいなら、できる事はここでのinputを工夫することだけです
どんな入力が結果に対して大きな影響を与えるだろうか?
その部分は小学生にも、データサイエンティストにも考えられないのです。
それができなければ、無駄にビッグ・データを要求されるのです。

だから、化学に精通した研究者は、リスキルをしてはいけないのです。
LowとHighのボタンの(自動)押し方を覚えれば良いだけです。
ちょっと、エクスパンド・スキルで広げれば良いだけです。
難しいことなどありません。ポチするだけです。

経験上、Binding energyは”ある物性値とこんな関係がある”事を知っていれば(予測できれば)、ニューラルネットワークは少ないデータでも、精度高い予測値を与えてくれるのです。


そして、この図で外れる2つの化合物に思いを馳せることで新しい発見につながるのです。

化学系の学生がソフトを使えるように教えるのと、データサイエンス系の学生に化学を教えるのと、どっちが難しいか?
まー、答えは言うまでもないでしょう。化学の現象に対してきちんとしたニューラルネットワークができている学生の脳味噌の方が圧倒的に大事です。



ある物性値って何だと思います?
Tech-Pot サイエンスカフェでお待ちしています。

細かいこと、生データはこちらをお読みください。
コロナウイルス、スパイクの結合エネルギーを予測してみよう
というブログに書いています。

化学が専門で、化学系プログラミングが趣味な私は最強ですかね。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です