2022.9.10改訂(2010.7.15)
pirika.comで化学 > 化学全般
> 次世代HSP2, YMB Pro for MI >
> 解析例トップ
HSP基礎トップページ > ハンセン溶解度パラメータ(HSP)のデータの取り込み
概要
自分のもつデータベースに、HSPの値や、Y-MBで推算した物性値を取り込みたい時には、まずSmilesの構造式を準備して、Y-MBの中にある、file convertの機能を使う。
化合物のHSP、分子体積、使っている官能基の数をバッチで計算してファイルを作ってくれる。
Y-MBの推算値をデータベースに取り込みたい場合には、Developerバージョンを使うか、一つ一つ手作業でSmilesの構造式から計算して、推算値を戻さなければならない。
内容
ユーザーは既に化合物のデータベースを持っており、その化合物の追加情報としてHSPやY−MBで提供されるデータを利用したいだけの事もあるだろう。
そのような場合のやり方を説明する。
手持ちのDBの中にSmilesの構造式が含まれるかどうかで簡単さは大きく変わる。
HSPiPや関連のソフトウエアーは分子の構造をSmilesの構造式で扱う。
Molファイルも扱えるが、例えば表計算ソフトで扱うといったらSmilesで扱うしか無い。
もしDBの中にSmilesの構造式が無ければ作らなければならない。
自分はMacを使うため選択肢は限られている。Smilesの構造式を探す場合は、ネットでChemSpiderのサイトへ行き、そこから取ってくる。
ウインドウズを使っているのなら、市販、フリーの様々なソフトがあるので、それを使って、とにかく、Smilesの構造式を準備する所まではやらなくてはならない。
今回の改訂で、ほとんどのデータはSMILESの構造式も含めて提供している。
まず、どれかをExcelなどにコピペしておこう。
テキストファイルを作り、Y-MBで計算してみよう(Y-MBは物性推算機能)
解析用のデータをメモ帳などのテキストエディターで作成する。
フォーマットは単なるタブ区切りのテキストデータで、複数の名称とSMILESのみ(タイトルなし)からなる。
このファイルをY-MBのFileから選択する。
左のFileボタンはフォーマットのチェック用だ。問題なければ右のFileボタンを押す。

次に変換にかけるファイルを選択する。
すると自動的にY-MBで計算して結果をhsdxかsofxフォーマットで書き出す。
(クリップボードにもペーストされているので、Excelなどにペーストできる)
元のテキストデータ(タイトルなし、化合物名称 tab Smilesの構造式)
dimethyl phthalate O=C(OC)C1=CC=CC=C1C(OC)=O
diethyl phthalate O=C(OCC)C1=CC=CC=C1C(OCC)=O
Benzyl Butyl Phthalate CCCCOC(=O)C1=CC=CC=C1C(=O)OCC2=CC=CC=C2
dibutyl phthalate O=C(OCCCC)C1=CC=CC=C1C(OCCCC)=O
Bis (2-ethylhexyl)phthalate O=C(OCC(CC)CCCC)C1=CC=CC=C1C(OCC(CC)CCCC)=O
dioctyl phthalate CCCCCCCCOC(=O)C1=CC=CC=C1C(=O)OCCCCCCCC
すると、上のようなテキストファイルから、file.hsdx(xmlフォーマットのデータ)が得られる。
<?xml version="1.0" encoding="utf-8"?>
<HSP_Data>
<Chemical>
<No.>1</No.>
<Solvent>dimethyl phthalate</Solvent>
<SMILES>O=C(OC)C1=CC=CC=C1C(OC)=O</SMILES>
<CAS />
<δD>18.3</δD>
<δP>9.2</δP>
<δH>4.8</δH>
<δHD_x002F_A>0.1/4.4</δHD_x002F_A>
<MVol>163.6</MVol>
</Chemical>
<Chemical>
<No.>2</No.>
<Solvent>diethyl phthalate</Solvent>
<SMILES>O=C(OCC)C1=CC=CC=C1C(OCC)=O</SMILES>
・・・・・
<MVol>399</MVol>
</Chemical>
</HSP_Data>
hsdxファイルはHSPiPから普通にオープンできる。
オープンしてできたテーブルはコピーボタンでクリップボードへペーストできるので、それをエクセルに戻すのは簡単だ。
file_Full.txtはYMBの推算結果を全て含んだtabテキストなので、エクセルにペーストして利用できる。
このように計算したい化合物のSMILES構造式をExcelなどにまとめて(PubChemやChemSpidarなどから集めて)おけば、簡単にHSPiPで扱えるのでとても便利だ。
その後は、リレーショナル・データベースで管理すれば良い。
私はファイルメーカープロをこれまで使ってきたが、最近あまり好きではない。
MacのOSが上がるたびに動かなくなり、新しいバージョンの購入を要求される。
Windowsと異なり、Macのバージョンアップはとても頻繁に行われる。
その度に購入し直しではたまらん。
以降古い記述

そして、上のようなテーブルを作る。そしてNo, Smilesの部分だけをテキストファイルとしてセーブする。
ファイルの拡張子は.txtにしておく。
(3.1.Xでは変わるかもしれないが,タイトル行はさしあたって含めない方が良い。)

そして、HSPiPを立ち上げ、σ(DIY)を選び、Y−MBのFile Convertボタンを押す。
そして先ほどのSmilesのテキストファイルを選択する。
すると1行づつSmilesを読み込み、それを原子団に分割し、HSPを計算し、結果を.ssdファイルとしてセーブしてくれる。 ver.5あたりから、hsdxの形でしか出力できなくなった。hsdxをHSPiPで読み込み、結果をクリップボードにコピーして、Excelにペーストするしかなくなった。
そのファイルをメモ帳とかで開いて全てを選択して、先ほどの表計算ソフトにペーストする。

このように、非常に簡単にHSPの値と、分子体積、分子量、官能基の種類と数のリストを作成することができる。
これを元の自分のDBに戻せば、HSPを使ったHPLC予測だとか、分配係数、溶解性などなどを扱う事ができる。

また、Smilesをコピーし、Y-MBにペーストし、電卓ボタンを押すと、Y−MBが様々な物性を推算する。
この推算値はクリップボードにコピーされているので、表計算にそのままペーストできる。

見やすいように整形すると上のような物性値がクリップボードにコピーされていることがわかる。この場合はバッチではなく、手作業で一つ一つY−MBしなくてはならない。

開発者バージョンのHSP Studioを使う場合には、2500までのSmilesを一括で処理することができる。
そして全ての物性推算値と官能基の数のリストを出力するので、物性推算値DBと官能基DBがたちどころに作成できる。
現在の1万化合物のDBが10分程度で処理できる。

出来上がったものを、リレーショナルDBで接続し、一元管理する。
自分はファイルメーカーproを使っているが、基本的にはどんなDBでもリレーショナル機能を持っていれば、自分のDBの中にHSPなどを取り込むことができる。
HSPiPのバッチ処理に関してはあまり使われては居ないようである。
うまく使いこなすと作業が非常に効率化する。
Y−MB物性推算も含めたバッチ処理化など、要望が増える事を期待する。
pirika.comで化学 > 化学全般
> 次世代HSP2, YMB Pro for MI >
> 解析例トップ
HSP基礎トップページ > ハンセン溶解度パラメータ(HSP)のデータの取り込み
Copyright pirika.com since 1999-
Mail: yamahiroXpirika.com (Xを@に置き換えてください)
メールの件名は[pirika]で始めてください