MIRAIによるMI(マテリアル・インテグレーション)研究

普通のMI(Materials Informatics)を仕事に活かせない業界は非常に多いようです。
ここでは、特許に記載されている一例を紹介します。

Beta欄は官能評価(とても良いと感じる=5、とても悪いと感じる=1)結果です。A,B,Cは、配合成分です。それぞれの成分は市販品として販売されており、正確な内容はわかりません。カーボンブラックのようなものを想像してください。CB(A-1)はW社から、A-2はX社から、A-3はY社から購入しています、などです。

分かっているのは、それぞれの成分をどれだけ使って配合したか、官能評価値がいくつ得られたかだけです。
さらに、官能評価には複数の種類があります。

私たちがやりたいのは、MIを使って、複数の官能評価値の予測値が得られ、すべての評価値が5点になるような処方を設計することです。

しかし、この場合、RDKitの識別子も分子軌道計算の結果も使えません。
また、官能評価には何百人もの人のデータを集めるため、データを増やすことも容易ではありません。

この問題に対して、MIの研究者はどうすればいいのでしょうか?

腕に自信のある人は、次のデータで予測式を作り、予測処方の値を予測してみてください。

CompoundBetaA-1A-2A-3A-4A-5A-6A-7B-1B-2B-3B-4B-5C
E6500001500000201049
E1250001200430000049
E1500150000200001049
CE1215000000200001049
CE1210001500000300049
E4500150000000201049
CE821400100030000049
CE5401500000000201049
CE1040001500060000019
E94000150000.1000078.9
CE142000150000000079
E850002500030000039
E1050001500050000029
E115000900630000049
CE1120001500003000049
CE1320001500000003049
CE6200000150000201049
CE2401500000200001049
CE950003000030000034
CE720001500000001069
E750001500030000049
E5500015000000201049
Predict
CE4215000000000201049
E2500015000200001049
E1350001400230000049
E3500001500200001049
CE3200000150200001049

Pirikaには新しい分析ツール、MIRAI(Multiple Index Regression for AI)があります。

今回、このツールをWebアプリ化しました。

通常の重回帰解析では、次のようになります。

重回帰法の欠点として、説明変数間に相互作用があるもの、非線形なものには使えないことが挙げられます。

それに対して、MIRAIはフィードフォワード型のニューラル・ネットワーク法で、データ数がこのように少なくても、予測性能を維持できるように設計されています。

beta= C0 + Σ[(Ca*Xa+Cb*Xb・・Ci*Xi+1)^α
  *(Cm*Xm+・・・ +Cq*Xq+1)^γ 
  *(・・・    +Cz*Xz+1)^ω ]

今回の解析では、パワー関数の掛け算でベータの値を再現する式を構築し、学習に含めなかった処方の結果を推算しています。

4種類の推算式を構築してしまえば、後はコンピュータ上で片っ端に評価がオール5になる処方を探させれば良いのです。

I will put this MIRAI into GROVE.

塗料、インク、化粧品の特許への応用例をこちらにまとめました。