pirika logo

ホームページ Pirikaで化学 ブログ 業務リスト お問い合わせ
Pirikaで化学トップ 情報化学+教育 HSP 化学全般
情報化学+教育トップ 情報化学 MAGICIAN MOOC プログラミング
MAGICIANトップ MAGICIAN-Jr. MAGICIAN-講義 過去の資料

A MAGICIAN is a person who can associate Materials Genome, Materials Informatics, Chemo-Informatics and Networks.
MAGICIANとは、材料ゲノム(Materials Genome)、材料情報学(Materials Informatics)、情報化学(Chemo-Informatics)とネットワーク(Networks)を結びつけて(Associate)いかれる人材です。

MAGICIAN Training Course > Lecture materials > Formulation top page > Design of paint formulations 塗料の配合処方設計

2021.10.29

MAGICIAN(MAterials Genome/Informatics and Chemo-Informatics Associate Network)Training Course

MAGICIAN養成講座

MIRAI (Multiple Index Regression for AI)

How to use the analysis tool MIRAI.

解析ツールMIRAIの使い方。

The basic specifications of MIRAI have already been explained.
MIRAIの基本的な仕様は既に説明した。

In this section, we will introduce an example of using MIRAI to design formulation for paints.
ここでは塗料用の配合処方設計にMIRAIを使った例を紹介する。

Example of data to be analyzed

解析したいデータの例

Consider a powder coating of a mixture of fluoropolymers and hydrocarbon polymers. Fluoropolymers provide coatings with excellent weather resistance, but they are expensive.
フッ素ポリマーと炭化水素系のポリマーの混合物の粉体塗料を考える。フッ素ポリマーは耐候性に優れる塗膜を与えるが高価である。


If the coating looks like A, there is a risk of peeling at the boundary between the fluoropolymer (green) and the hydrocarbon polymer (blue).
Aのような塗装になると、フッ素ポリマー(緑)と炭化水素系のポリマー(青)の境界で剥離してしまう恐れがある。

When it comes to coatings like C, for the large amount of expensive fluoropolymers used, the hydrocarbon polymers that are part of the surface cause a deterioration in performance.
Cの様な塗装になると、高価なフッ素ポリマーを大量に使う割に、表面に一部ある炭化水素系のポリマーが性能の劣化を引き起こす。

As in the coating of B, the fluoropolymer is unevenly distributed on the coating surface and is responsible for weather resistance, while the composition gradually changes at the polymer boundary, making delamination difficult to occur.
Bの塗装のように、塗装表面にはフッ素ポリマーが偏在して耐候性を担い、ポリマーの境界では徐々に組成が変化し層間剥離を起こしにくい構造が好ましい。

Dainippon Paint's patent (JP WO2013/186832) realizes this kind of powder coating.
大日本塗料の特許(JP WO2013/186832)はこの様な粉体塗装を実現する。

In this patent, the following ingredients will be included.
この特許では次のような成分を配合する。



Polyester resin B and acrylic resin B are on the table, but there are no experiments in which they were used.
ポリエステル樹脂Bとアクリル樹脂Bはテーブルにはあるが、使われた実験は無い。

The following are the evaluations of the created coating. Five of them will be analyzed in this section.
作成された塗膜は次の様な評価が行われている。その中の5つについて解析を行う。



Let's copy all the following data and paste it into a spreadsheet.
次のデータを全てコピーして表計算ソフトにペーストしておこう。

The meaning of the data is as follows.
データの意味は次の様になる。



Type in the data for the patent.
特許のデータを打ち込む。

Once that is done, the first step is to separate the data for training and prediction. To do that, I generate a random number in the last column of the table and sort it. The last few rows are then used as the prediction data. The objective variable for the predictive data should be set -0.9876.
それができたら、まず学習用のデータと予測用のデータに分ける。それには、テーブルの最後の列に乱数を発生させて、ソートをかける。そして行の最後のいくつかを予測データにする。予測用のデータの目的変数には-0.9876を入れる。

If the training dataset has no values, but the prediction dataset has values, they need to be replaced. (MIRAI can't give an answer for something MIRAI didn't learn.)
その際に、学習用のデータセットには値が無いが、予測データセットに値がある場合には入れ替えが必要になる。(学習しなかったことに対しては答えを出せない。)

The dataset for prediction does not have to be included in the training, but when it is, the value should be set to -0.9876.
予測用のデータセットは、学習に含めなくても良いが、含める時には値を-0.9876にする。

MIRAI uses multiplication of exponential functions to create a physical property estimation formula.
MIRAIでは指数関数の掛け算で物性推算式を作成する。

(linear function)exponential
(線形関数)指数

It is rare that a linear function created with training data becomes negative in parentheses when it is applied to prediction data.
学習データで作成した線形関数を予測データに適用した際に括弧の中がマイナスになってしまうことが稀にある。

To avoid this breakdown, it is preferable to include all outlines.
この破綻を避けるため、説明変数のアウトラインを全て入れておく方が好ましい。

Finally, divide the similar explanatory variables into the same group. In this case, I will use B1 and B2 for the hydrocarbon polymers and C1, C2, and C3 for the three curing agents in the same group.
最後に、説明変数の似たものを同じグループに分ける。ここでは炭化水素ポリマーをB1,B2にするのと、硬化剤3種類をC1,C2,C3と同じグループにする。

Since the data is pasted into the web app in a tab-delimited format, it is convenient to organize the data in Excel.
データはタブ区切りでWebアプリにペーストするので、エクセルなどに整理しておくと便利である。



Then copy&paste the main table and groupings into MIRAI, and click the MIRAI Read button.
そしてメインテーブルとグループ分けをMIRAIにコピー&ペーストし、MIRAI Read ボタンをクリックする。

Then, when you want to retrieve the calculation results, press the STOP button. Then copy the formula spit out by MIRAI and paste it into the second row of Excel. In order to create this formula correctly, each row and column needs to be controlled reliably.
そして、計算結果を取り出す時には、STOPボタンを押す。そしてMIRAIが吐き出した式をコピーしエクセルの2行目に貼り付ける。この式を正しく作成するために各行と列は確実に制御される必要がある。

Do not change the title in the first row and first column, and the objective variable in the second row.
1行目、1列目はタイトル、2列目は目的変数は変えてはいけない。

After STOP, press the START button to continue the calculation. Continue the calculation until the values converge.
STOPの後、STARTボタンを押すと続きが計算される。値が収束するまで計算を継続する。

If the physical properties of the target are numerical values, use the numerical values as they are, and if they are ◯X△, change them to numerical values as appropriate.
ターゲットの物性値が数値の場合にはそのまま数値を使い、◯X△などは適宜数値に直して学習させる。



Press the STOP button to abort the calculation. Copy the formula after =. Paste it into the appropriate second line of Excel. Spread the calculated values over the whole, and change the columns for the predicted values. Then graph it. Continue the calculation until the values no longer change.
STOPボタンを押して計算を中断する。=の後の計算式をコピーする。エクセルの適当な2行目にペーストする。計算値を全体に広げ、予測値の部分は列を変える。そしてグラフ化する。値が変化しなくなるまで計算を継続する。

To compare with MIRAI, I perform the usual multiple regression calculation.
MIRAIとの比較するために、通常の重回帰計算を行う。

When you do a normal multiple regression, you don't include the predicted data, so open the Cross Term MR in YSB and paste the dataset into it. Press the Cross Term button and the result will be displayed in Result. CT=0 is the result of normal multiple regression, so put it back into Excel and make a graph.
通常の重回帰計算するときは、予測データは含めない。YSBのCross Term MRを開きそこにデータセットをペーストする。Cross Termボタンを押すとResultに結果が表示される。CT=0が通常の重回帰の結果なので、それをエクセルに戻しグラフを作成する。

In the same way, I calculate the other four properties.
同じように、他の4つの物性についても計算する。

Only the Res1:specular gloss is sufficiently descriptive and predictive for multiple regression (MR) methods.
Res1:鏡面光沢度だけは重回帰法(MR)でも十分な記述性と予測性を持つ。



Other than Res1, MIRAI is clearly superior to the multiple regression (MR) method.
それ以外の結果は、明らかにMIRAIの方が重回帰法(MR)より優れている。









Once such a highly accurate formula can be constructed, the optimal formula can be automatically designed by simulation alone.
この様な精度の高い推算式が構築できると、後はシミュレーションだけで最適処方を自動設計することができる。

This is why MIRAI (Multiple Index Regression for AI) is an excellent inference formula for AI.
MIRAI (Multiple Index Regression for AI)がAI用の推算式として優れている所以である。

Coating Analysis Example 2

塗料解析例2

Aqueous pigment dispersions and their manufacturing methods
水性顔料分散体及びその製造方法

DIC Corporation's JP 2019-189852 is a patent that specifies the blending of resins, pigments, and solvents based on Hansen's dissolution sphere and interaction radius.
DIC株式会社の、JP 2019-189852は、樹脂、顔料、溶媒の配合をハンセンの溶解球と相互作用半径から規定した特許です。

When I do dissolution or dispersion tests on resins and pigments in various solvents with known HSP, I can find the center of the HSP and the interaction radius of the target. If we draw a sphere of the interaction radius from the center, I can get Hansen's sphere of dissolution.
樹脂や顔料を様々なHSPが既知の溶媒で溶解試験、分散試験を行うと、対象のHSPの中心値と相互作用半径を求めることができる。その中心から相互作用半径の球を描くと、ハンセンの溶解球を得ることができる。

When the HSP of a certain solvent, pigment, etc. comes within this interaction radius, it is more likely to dissolve in that target.
ある溶媒、顔料などのHSPが、この相互作用半径の中に入ってくると、その対象に溶解する可能性が高くなる。

Web app Sphere Viewer


Drag=Rotate, Drag+Shift key=Magnify, Drag+Command key or Alt key=Move. If you click on a solvent, the name of the solvent will appear.

Drag=回転, Drag+Shift キー=拡大、縮小, Drag+コマンドキーかAltキー=移動。 溶媒をクリックすれば溶媒の名前が現れる。

Some polymers may have hydrophobic and hydrophilic regions.
いくつかのポリマーは、疎水的領域と親水的領域を持つことがある。

The DIC patent claims that the relationship is as follows.
このDICの特許では、次の様な関係になるようにクレームしている。


The dissolution sphere of the pigment overlaps the dissolution sphere of the hydrophobic region of the resin (Scheme1).
The HSP of the solvent is inside the dissolution sphere of the pigment(Scheme2).
The HSP of the solvent is inside the dissolution sphere of the resinhydrophobic region(Scheme3).
The HSP of the solvent is outside the dissolution sphere of the hydrophilic region of the resin(Scheme4).

顔料の溶解球は樹脂疎水領域の溶解球と重なる(Scheme1)。
溶媒のHSPは顔料の溶解球の内側にある(Scheme2)。
溶媒のHSPは樹脂疎水領域の溶解球の内側にある(Scheme3)。
溶媒のHSPは樹脂親水領域の溶解球の外側にある(Scheme4)。


Eight pigments, five resins, and four HSP distances (Scheme1-4) were calculated using the prescribed method.
顔料は8種類、樹脂は5種類、4種類のHSP距離(Scheme1-4)については所定の方法で計算を行った。

The objective variable is the volume-average particle size (nm), with larger values resulting in coatings with more coarse particles and lower dispersibility.
目的変数は体積平均の粒子径(nm)で、これが大きいと粗大粒子が多く分散性が低い塗料となる。

When using MIRAI to analyze this system, calculations can be performed in two different ways of taking the error.
MIRAIを使ってこの系を解析する時には、2種類の誤差の取り方で計算を行うことができる。



When using Minimum Absolute Error(MAE), the coefficients are set to try to minimize the sum of the absolute values of the differences between the supervised and calculated values.
絶対誤差最小(MAE)を使うと、教師値と計算値の差の絶対値の総和を一番小さくしようと係数を定める。

Then the ones that are far off will be further off, and the others will come on straighter and straighter.
すると、大きく外れるものはさらに外れ、他のものはどんどん直線に乗って来る。

This is very useful for identifying suspicious data, such as input errors.
入力間違いなど、怪しいデータを特定するときはとても有用である。

Using root mean square error (RMSE), MIRAI try to make something with a large error closer to a straight line.
二乗平均平方根誤差(RMSE)を使うと大きな誤差を持つものを直線に近づけようとする。

Assign a small error to each point. When squared, the small error becomes so small that it has no effect.
小さな誤差を各点に割り振る。小さな誤差は2乗すると、とても小さくなり影響を与えなくなる。



Ordinary multiple regression analysis also reduces the squared error, but because it cannot take into account nonlinearities and interactions between items, some items will be far off, making the correlation coefficient very bad.
通常の重回帰解析も、自乗誤差を小さくするが、非線形性や項目間の相互作用を加味でき無いため、大きく外れるものが出てきて、相関係数をとても悪くする。



Paint Analysis Example 3

塗料の解析例3

This example will also be patented by DIC. (JPA 2017-031336)
この例もDICの特許になる。(JPA 2017-031336)

The purpose of the patent is to obtain an active energy beam curable composition that can form a cured coating film with both excellent coating film appearance and high antistatic properties.
特許の目的は、「優れた塗膜外観と高い帯電防止性とを両立した硬化塗膜を形成できる活性エネルギー線硬化性組成物 」を得ることになる。

However, when the content of organic solvent is increased, the dispersion state of the metal oxide particles changes. And agglomeration occurs, which causes whitening of the hardened coating film and an increase in its surface resistance value.
しかし、有機溶剤の含有率を高くすると、金属酸化物粒子の分散状態が変化する。そして凝集を生じることで、硬化塗膜の白化し、その表面抵抗値が上昇する問題がある。

Dispersion term (δD) falls in the range of 15.6~16.1MPa0.5.
The polarization term (δP) is in the range of 7.2~9.8MPa0.5.
The hydrogen bonding term (δH) is in the range of 8.2~11.4MPa0.5.
It is claimed that the product is characterized by the inclusion of such organic solvents.
分散項 (δD)が15.6~16.1MPa0.5 の範囲に入る。
分極項(δP)が7.2~9 .8MPa0.5 の範囲に入る。
水素結合項(δH)が8.2~11.4MPa0.5の 範囲に入る。
そのような有機溶剤を含有することを特徴とするとクレームされている。

The actual experiment is summarized as follows.
実際に行った実験をまとめると次のようになる。



The areas marked in green are the patent claims. The areas marked in yellow are the limits. Those that fall outside the scope are not colored.
緑色にマークした部分は、特許請求の範囲に入る。黄色でマークしたところは限界値である。範囲を外れるものは色をつけていない。

There are a large number of patents that specify the Hansen solubility parameters (HSP) in these ranges.
このようなハンセンの溶解度パラメータ(HSP)の範囲で規定した特許は非常に多い。

However, if we plot the results of the four evaluations and each component of HSP, we get a very confusing figures as follows.
しかし、4つの評価結果とHSPの各成分を図示すると次のようにとてもわかりにくなる。

dD figure


dP figure


dH figure



So, as a patent claim, it only specifies a range of experiments with four ◯ evaluations.
そこで、特許のクレームとしては、4つとも評価が◯の物の範囲を規定しただけになる。

It is preferable for a patent to be invisible to all but the person who created it.
特許は作成した者以外には見通しの悪いものであったほうが好ましい。

So let's plot each component of HSP in 3D space and look at it.
そこでHSPの各成分を3次元空間にプロットして眺めてみよう。

Web app Sphere Viewer


Drag=Rotate, Drag+Shift key=Magnify, Drag+Command key or Alt key=Move.

Drag=回転, Drag+Shift キー=拡大、縮小, Drag+コマンドキーかAltキー=移動。

The translucent green sphere is called Hansen's dissolving sphere.
半透明の緑色の球がハンセンの溶解球と呼ばれるものだ。

Let's drag with the mouse to check the position.
The spheres marked in red are solvents with all four ratings being ◯.
The balls in blue are solvents with poor ratings.
マウスでドラッグして、位置関係を確認しよう。
赤で示してある球は4つとも評価が◯の溶媒である。
青で示してある球は評価が悪い溶媒である。

And the way Hansen Solubility method says it is as follows.
"Solvents that are in the Hansen Solubility Sphere are rated high (4 ◯).
The center of the Hansen sphere is [dD,dP,dH]=[15.9, 8.9, 9.8] and the radius is 2.0.
そして、ハンセンの溶解度法の言い方では次のようになる。
「ハンセンの溶解球に入ってくる(混合)溶媒は評価が高い(◯が4つ)」
ハンセンの溶解球の中心は[dD,dP,dH]=[15.9, 8.9, 9.8]で半径は2.0である。

In a patent claim, the scope is cubic, so the range is a little wider.
特許のクレームだと、範囲は立方体になるので、少し範囲が広くなる。

It is often thought that this is an excellent method and can prevent other companies from entering the market.
この方法は優れた方法で、他社の参入を予防できると考えられがちである。

However, if we plot the polarization term (δP), we can see that they did not try it in solvents above 9.8MPa0.5.
しかし、分極項(δP)が9 .8MPa0.5 以上の溶媒では試していないことがプロットしてみるとわかる。

HSPiP and MIRAI analysis tools are like two wheels of a wheel.
When we analyze it with MIRAI, we can find out many more things.
HSPiPとMIRAI解析ツールは車の両輪のような関係である。
MIRAIで解析すると、さらに色々なことがわかってくる。

Let's analyze it a little deeper.
もう少し深く解析してみよう。

The HSP of the solvents used in the claim are not for pure solvents, but for mixtures.
クレームに使われている溶媒のHSPは単独溶媒のものでは無く混合溶媒のものだ。

In the actual patent, various solvents are used in combination, and the patent is claimed in the range of HSP of the mixed solvents.
実際の特許では、様々な溶媒が組み合わされ使われている。そして、その混合溶媒のHSPの範囲で特許がクレームされている。

The original table can be summarized as follows.
元のテーブルをまとめると次のようになる。



The last two experiments will be used as predictive data.
最後の2つの実験を予測データとする。

Four of the physical properties are used as the objective variables. Antistatic ability and surface resistance are particularly important.
目的変数は、物性値のうちの4つを使う。特に帯電防止能力と表面抵抗は重要である。

Next, for MIRAI, we divide the solvents into groups.
次に、MIRAI用には溶媒をグループに分ける。

This grouping is a testament to the skill of chemists.
このグループ分けは、化学者の腕の見せ所である。

The grouping is determined not only by the functional groups of the solvent, but also by the amount used.
溶媒の官能基だけでなく、使われている量などからもグループ分けを判断する。

1. alcohol group
2. ester, ether group
3. ketone group
4. other

1. アルコール・グループ
2. エステル、エーテル・グループ
3. ケトン・グループ
4. その他



The coefficients of antistatic ability analyzed by the usual multiple regression method and by MIRAI are included in the table.
帯電防止能力を通常の重回帰法で解析した係数と、MIRAIで解析した係数をテーブルに含めてある。

As can be seen from the graph, even with the usual multiple regression method, the reproducibility of the solvents used to construct the equations is reasonably high.
グラフからわかるように、通常の重回帰法であっても、式を構築するのに使った溶媒の再現性はそれなりに高い。

The calculated value of the compound for prediction exceeds 6, but for this kind of rank evaluation, a value of 4 or higher is acceptable.
予測用化合物の計算値が、6を超えるが、このようなランクの評価では4以上であれば問題ない。

Antistatic Bbility : 帯電防止能



On the other hand, the MIRAI analysis result evaluates the value of 1 as 1.79.
This is due to the fact that even though the solvent composition of the experimental CE12 is very similar to CE1, the evaluation is very different.
それに対して、MIRAIの解析結果では、評価値が1のものを1.79と評価している。
これは、実験CE12はCE1と溶媒組成が非常に似ているにも関わらず、評価が大きく異なることに起因する。



Surface Resistance : 表面抵抗


Similarly, for surface resistance, there are two experiments that are outliers in RIRAI.
This is also CE12 and CE1.
同様に表面抵抗でも、RIRAIでは外れる実験が2つある。これもCE12とCE1である。

Ordinary multiple regression analysis cannot be used for systems where there are interactions between items or nonlinearities in the items. MIRAI is suitable for the analysis of such systems.
通常の重回帰解析では、項目間に相互作用があるもの、項目に非線形性があるものには使えない。そのような系の解析にはMIRAIが適している。

Can we say that multiple regression analysis is sufficient for this system?
この系は、重回帰解析で十分と言えるのだろうか?

A very common and big mistake.

非常に良くある大きな間違い。



For example, CE10 has all rated values of X. Based on this, let's examine the formulation to get a higher rating from the multiple regression coefficients.
例えば、CE10は全ての評価値がXである。これをベースにして、重回帰係数から評価が高くなるように処方を検討してみよう。

Let's change the S1-1 solvent, 0.67g, to 0g and increase the S1-2 solvent by that amount.
S1-1の溶媒,0.67gを0gにして、その分S1-2溶媒を増やしてみよう。

Properties Exp. CE10 -MR New Comp. -MR CE10-MIRAI New Comp. -MIRAI
Antistatic 1 1 579.36 0.99 0.94
Surface resistance 39 39 -1092.72 39.04 40.05
Appearance 1.0 1 -22.07 1.0 0.97
Storage stability 1.0 1 1.0 1.02 0.27


物性値 実験値 CE10の組成重回帰 新組成重回帰 CE10の組成MIRAI 新組成MIRAI
帯電防止 1 1 579.36 0.99 0.94
表面抵抗 39 39 -1092.72 39.04 40.05
外観 1.0 1 -22.07 1.0 0.97
保存安定性 1.0 1 1.0 1.02 0.27


A small change in composition can change the results of the multiple regression method by a factor of 500, plus or minus.
組成をほんの少し変えただけで、重回帰法では結果が500倍、しかも、プラスマイナスに変動してしまう。

In neural networks method, this problem of overlearning is well known.
ニューラルネットワーク法では、こうした過学習の問題はよく知られている。

These variations also occur in multiple regression analysis when the multiple regression coefficients consist of very large ± values.
重回帰解析でも、重回帰係数が非常に大きな±の値で構成されているときに、こうした変動が起こる。

I am not an expert in statistics. Maybe the statistics will tell me not to use this result.
私は統計に詳しいわけではない。もしかしたら、統計的には、この結果を使うなと言ってくれるのかもしれない。

If we can't use multiple regression analysis, what are we supposed to do about formulation development? What can statistics do for this problem?
重回帰解析が使えないなら、処方開発をどうしろというのか? 統計はこの問題に対して何をしてくれるのか? 

I need a good tool for formulation development, whether it's a neural network method, PLS method, or PCA method.
ニューラルネットワーク法、PLS法、PCA法なんでも良いから処方開発に適したツールが欲しい。

Maybe I'm not looking hard enough and such a tool already exists. If you know, please let me know.
もしかしたら、探し方が悪いので、そのようなツールはすでにあるのかもしれない。もしご存知なら教えていただきたい。

I'm not good at statistics, but I am good at programming, so I created the MIRAI analysis tool for myself.
統計は得意ではないが、プログラミングは得意なので、自分用に作ったのがMIRAI解析ツールである。

Changing the composition of CE10 slightly did not change the results significantly. Only one experimental value of 1 is predicted to be 0.27, but since the result is 1 for X, it is not a problem since all results below 1 are X.
CE10の組成を少し変えても、結果は大きく変化はしていない。一つだけ実験値1を0.27と予測しているが、結果がXのものが1なので、1以下は全てXとなるので問題ない。

MAGICIAN Training Course > Lecture materials > Formulation top page > Design of paint formulations


Copyright pirika.com since 1999-
Mail: yamahiroXpirika.com (Xを@に置き換えてください) メールの件名は[pirika]で始めてください。
Mail: yamahiroXpirika.com (Replace X with @.) The subject of your email should start with [pirika].