今回はMolGANという化合物生成器の実装を試みたので、その解説をしていきます。

MolGANの概要
_______
これは化合物生成をGANという手法で、生成-識別というのを繰り返し、生成させるpathと強化学習を用いて望みの性質を持つ化合物を生成させるように学習させるpathを組み合わせた生成モデルとなります。

生成速度が速く、存在できる化合物の生成率が高い一方で、mode collapseに陥っていまい、多様性という面ではいまだに課題が残っているような手法になります。
_______

そしてこれを実装してみたところ、MolGANを現在(2022/03/06)に実装することはできませんでした

具体的に原因を解説していきます。

まずMolGANはこちらにあるpre論文を参考にしました。
コードも取得できます。

タイトル : MolGAN: An implicit generative model for small molecular graphs


まずはGitHubからコードをダウンロードしました。
ファイル名 : MolGAN-master

それをjupyter notebookにてコードを打ち込み実装して見たところ
FilenotFoundErrorが出たので、見つからないファイルをダウンロードすることにしました。

ORGANというGitHubからダウンロードし、MolGAN-master/dataに加えました。

スクリーンショット 2022-03-03 10.56.01



スクリーンショット 2022-03-03 10.55.23


加えたのは赤枠で囲んである、2つのzipファイルです。

この後、再びコードを実行してみたところ、またFilenotFoundErrorが出ました。

スクリーンショット 2022-03-03 10.54.36

そこで再び、こちらのgdb9_9nodes.sparsedatasetというファイルをダウンロードするために探してみたところ、

スクリーンショット 2022-03-03 10.56.38

このようなサイトに辿り着き、このファイルは入手不可能であることを知りました。

よってこのファイルをどうにかして入手するか、このファイルの代替品を用意するかしか、MolGANを実装することはできないです。。


それでは今回はここまで。

【参考文献】
1) MolGAN: An implicit generative model for small molecular graphs