原子団寄与法

2026.3.25

pirika.comで化学
>チャピエモン-3rd Pirika Origin (CPO)
> ハンセン溶解度パラメータ (HSP)
> 化学全般
>
情報化学  >物性化学 >高分子化学 >化学工学 >その他の化学 >昔のもの
>情報化学ツール >MAGICIAN養成講座 >STEAM
>Pirika ツール群
ブログ
業務案内
お問い合わせ

情報化学ツール > 原子団寄与法
原子団寄与法の基礎
Dynamic Group Contribution
 DGCの応用例
 DGCの原子団拡張

[1. 概要]

原子団寄与法(Group Contribution method)は分子の熱物性を推算する方法として開発された。Lydersen法、Joback法[*1]、ポリマー用ではVan Krevelen法[*2]など多くのものが知られている。分子を原子団に分ける。その原子団に係数を定め、原子団iの数*係数iの総和が物性値になる。式の性質上原子団が多くなると大きくなる物性値に適用される。そこで化合物の沸点や臨界温度[*1]を推算する方法として発展した。同じ熱物性値でも密度[*3]は分子を構成する原子団の数が増えても大きくならない。密度タイプの物性値には原子団寄与法は使えない。原子団寄与法が使えるかどうかは、低分子と高分子の物性を考えてみれば良い。屈折率[*4]や表面張力[*5]は分子が大きくなっても値が大きくなる物性値ではない。密度は、分子量を分子体積で割ったものになる。分子量は定義値で分子体積は原子団寄与法で推算できる値である。そうした変換をすると密度も原子団寄与法で推算できる。原子団に絶対的な化学上の意味を持たせる場合には数学とは異なる取り扱いが必要になる。より好ましい方向へ分子設計したい場合には、原子団の係数が大事な設計指針になる。

[2. 原子団寄与法の問題点]

原子団寄与法の問題点と重回帰法[*6]の問題点は重なる。ここでは原子団寄与法ならでの問題点を示す。例えば分子量を原子団寄与法で推算することを考える。

=α1x1+α2x2αnxn+Const.  (1)  αx分子量 = α1*x1 + α2*x2 ・・・αn*xn + Const.  (1)   α:係数、x:原子団の数

式(1)式を満たし、分子量とその計算値の相関が高ければ重回帰法の計算式としては正しい。しかし、原子団寄与法としては正しくないことがある。第1の問題点は定数の問題だ。沸点を推算するJoback式[*1]では定数を使う。それで良い場合もある。分子量の場合は定数を持ってはならない。 原子団の分子量は、C: 12.011, H: 1.00794, O: 15.9994と構成する原子量で厳密に決まり、定数はない。また、係数は負になってはならない。沸点や蒸発潜熱[*7]に関しては係数が負になったり定数を持ったりしても良い。しかし分子体積や分子量は係数が負になったり定数を持ったりしては数学的には正しくても化学的には間違っている。原子団は化学的に意味のある塊だ。相対的に沸点や蒸発潜熱を上げ下げする原子団があっても良い。しかし絶対的に分子体積や分子量を決めなくてはならないこともある。また化学には化学特有の問題がある。反応収率は0%以下も100%以上もない。水への溶解度は100gの水に対して100g以上溶解した時には実験は打ち切られる。log Sが2以上は数値に意味はない。逆に昔の測定限界はlog S=-4 あたりであった。現在はさらに少量の溶解度まで測定できる。log S=-4あたりの実験値の信頼性が非常に低い。引火点は110℃以上は測定せず、>110℃ と記載される事が多い。書籍からコンピュータにデータが移植される時に、フィールドを文字で扱うか数値で扱うかを決めなくてはならない。その時に>という記号が失われた。ある上限、下限を超えた場合の取り扱いは化学では必須である。
pirikaで開発した重回帰法はこれらの化学的意味合いに答えれるように設計してある。

[3. 結合を切断してしまう事の問題点]

分子を原子団に分割してしまうと結合情報は失われる。それを回避するために大きな原子団を定義していく。原子団が増えると係数を決定するためのデータ数もどんどん増える。
DGC(Dynamic Group Contribution)法[*8]は、定義した原子団がどんな原子団に結合しているかによってその原子団の数え方を変える方法だ。原子団寄与法は結合を切ってバラバラにしてしまう。例えばCF3COOCH2CH3という化合物とCF3CH2COOCH3という化合物は同じ原子団(CF3, CH3, CH2, COO)なので物性値は同じになってしまう。これを、CF3-COOとCF3-CH2でCF3の数え方を変えるのがDGC法だ。
学習したデータセットに無い結合相手だった場合には1と数える。結合を切ることによって情報が失われる事を嫌う場合には、分子軌道計算(MO計算)やトポロジー計算を使うことが多い。しかしMO計算のHOMO, LUMOやダイポールモーメントが分子全体の性質を表した所で、HOMOの値を+1ev大きくする逆設計ができるわけではない。DGCを使うことによって原子団間の情報の流れが明確になり逆設計が容易になる。

[4. 原子団分割のアルゴリズム]

YMB(Yamamoto Molecular Break)法、YPB(Yamamoto Polymer Break)法がSMILES[*10]の構造式、ポリマーSmilesの構造式から原子団のリストを得るアルゴリズムになる。原子団の取り方を固定にしDBを作成すると、原子団の取り方を変えるたびにDBの再作成が必要になる。そこでDBにはSMILESだけを搭載し、必要な時にダイナミックに原子団を作成する。Joback法、Van Krevelen法法など異なる体系の原子団を使う場合にはYMB, YPBからのコンバーターを作成する。

No  CH3 CH2OHNo 物性値 CH3数 CH2数・・・OH数・・

分子の数だけ物性値と原子団リストの行を持ったテーブルを作成する事ができる。
DGC用のテーブルは次のようなフォーマットを作成する。

No  CH3_sub1 CH2_sub2_sub3No 物性値 CH3_sub1 CH2_sub2_sub3 ・・・・

用いたリストを用いて物性推算式を作成する。合わないものがある。新たな原子団を定義する。その繰り返しになる。拡張性を考慮した設計が重要になる[*11]。

[5. Pirikaの重回帰法]


[x. Pirika.comのリンク]

*1: Joback法熱物性推算法
*2: Van Krevelen法ポリマー物性の推算
*3: 密度
*4: 屈折率
*5: 表面張力
*6: 重回帰法
*7: 蒸発潜熱
*8: DGC(Dynamic Group Contribution)法
*9: 原子団リスト
*10: (Polymer) SMILES(Simplified Molecular Input Line Entry Syntax)
*11: DGCの原子団の拡張


*6: 溶解度パラメータ(SP値)

*8: 分子体積



Copyright pirika.com since 1999-
Mail: yamahiroXpirika.com (Xを@に置き換えてください)
メールの件名は[pirika]で始めてください。