SMILES分子構造ビュアー、複数分子対応版

2022.2.25

情報化学+教育 > 情報化学 > SMILES分子構造2Dビュワー

pirikaでは分子構造はSMILESの構造式で扱っている。
SMILESとはSimplified Molecular Input Line Entry Syntaxという分子の線形記法のことだ。
この方法のメリットはアスキー文字列の小さなサイズでコンピュータが理解できるように分子を表記できる事だ。

ハンセンの溶解度パラメータのページやAI/MI/MLのMAGICIANのページでも、複数のSMILES構造式をテーブルの形で提供している。

機械学習させるのに一つ一つの分子構造を人間が見る必要は無いが、例えば計算が合わない化合物はどんな構造をしているのかチェックする時には構造が必要になる。
特に大きな薬などの時には重宝するだろう。

方法は簡単なので、自分のブログに導入してみれば良いだろう。
まず、ExcelなどでSMILESを含むデータを作成する。データの作成にはJSMEを使って分子を描くか、ネットで検索する。それをJSON形式(簡単に言えば、タブや改行の制御コードも含めて一行のテキストで表してしまう)でテキストに持たせる。
そして、そのテキストをtextareaに流し込む。(こうしておくと、それをコピペした時にタブがタブとして認識されるので、訪問者がエクセルなどにペーストしやすい。)

そして、そのtextareaからSMILESの部分を取り出し、RDKitで2次元の分子構造を作成させて一つづつ表示させれば良い。RDKitのサイズが大きいのでそれなりのスピードのネット環境が必要だ。


***


Copyright pirika.com since 1999- 
Mail: yamahiroXpirika.com (Xを@に置き換えてください) メールの件名は[pirika]で始めてください。