ようこそインシリコデータのWEBサイトへ
ヘッダーイメージ 本文へジャンプ
 「テーラーメードモデリング」による予測の実施


本HTMLページ内でのキーワードおよび関連語:テーラーメードモデリング(予測)
テーラーメードモデリング、テーラーメード、分類率、予測率、予測モデル、カスタマイズド予測モデル、予測モデルのサンプル毎の構築、判別関数、重回帰式、インシリコスクリーニング、インシリコADME-Tスクリーニング、インシリコADME/Toxスクリーニング、並列創薬、インシリコ創薬、並列インシリコスクリーニング、インシリコ毒性スクリーニング、創薬、機能性化合物デザイン、予測率、サンプル母集団、サンプル数、予測モデルの再構築、予測モデルの自動構築、新規サンプルデータ、サンプルデータベース、メンテナンス


 「テーラーメードモデリング」による予測は、名前からわかるように、予測対象サンプル毎に最適な予測モデルを作成し、その個別にあつらえた予測モデルを用いて個々のサンプルを予測するものです。これは、従来からのデータ解析の方向性/手順(従来手法では、汎用性の高い予測モデルを作成し、この予測モデルを用いてサンプルの予測を行う)を180度ひっくり返したアプローチです。この手法により、実務上は分類率よりも重要な値である予測率を大きく向上することが可能となります。
 本手法の実行には予測対象サンプル毎に専用の予測モデルを作成するため、従来手法とは比較にならない程の計算時間がかかります。しかし、現在得られるコンピュータのCPUパワーの急激な向上が、このような手法を実現可能としました。

・予測モデルの個別構築により、高い予測率を実現
 従来手法では、予測を行うための判別関数や重回帰式をあらかじめ与えられたサンプル群を用いて予め構築しておき、予測対象サンプルはこれらの予め作成された判別関数や重回帰式を用いて予測されます。従って、予測モデルは予め用意されており、予測対象サンプル毎に作成されることはありません。サンプル予測という観点で考えると、このアプローチには大きな欠点があります。この欠点は、どんなサンプルが来てもある程度の予測精度を持たせる、つまり予測の汎用性を保証するために、広範囲な化合物構造式や特性を持ったサンプル群を用いて予測式を構築することです。この結果、予測対象サンプルからみた場合、この予測式には予測対象サンプルとは関係のないサンプル群(これは予測サンプルから見た場合ノイズサンプルに該当する)の情報が入っており、これらの情報は当面のサンプル予測にはノイズ情報となり、相対的に予測精度を下げる結果となります。
 一般的には、予測対象サンプルと高い相関のあるサンプル群を用いて構築された予測式は高い予測精度を有することがわかっています。この原則から考えれば、予測対象サンプルごとに、予測モデル構築に利用するサンプルを厳選し、選ばれたサンプル群より構築された予測モデル(即ち、テーラーメードモデル)を用いれば簡単に高い予測率を達成する事が可能です。
 しかし、従来のアプローチでは、コンピュータパワーの問題もあり、予測対象サンプル毎に予測モデル(式)を構築することはできませんでした。しかし、コンピュータパワーが飛躍的に向上した現在では、予測対象サンプル毎に予測モデルを作成しても大きな負荷なく実行出来るようになっています。
 例えば、極めて多数のサンプル群や複数の予測項目をスクリーニングするインシリコスクリーニング (並列創薬、並列インシリコスクリーニング)では、個々の予測項目における予測精度や予測信頼性は少しでも高い値であることが必要です。また、「インシリコ毒性スクリーニング」ではその特性上誤分類が許されませんが、今後の創薬や機能性化合物デザインではこの「インシリコ毒性スクリーニング」が重要なキーテクノロジーとなります。今後の創薬および機能性化合物デザインで重要な役割を果たす「インシリコスクリーニング」や「インシリコ毒性スクリーニング」の最も重要な指標が「予測率」です。今後の創薬や機能性化合物開発では少しでも高い予測率を出すことが要求されます。このような要求に答えるのが「テーラーメードモデリング」による予測です
・テーラーメードモデリングのその他の特徴

「テーラーメードモデリング」
では、予測対象サンプルごとに予測式を構築します。今後は高い予測率を達成できる「テーラーメードモデリング」が予測を行う時のスタンダードとなるでしょう。この「テーラーメードモデリング」は単に高い予測率の達成のみならず、そのほかにモデル様々な利点があります。
1.サンプル母集団のサンプル数が大きいほど予測精度が向上する。
 この「テーラーメードモデリング」はサンプル母集団のサンプル数が大きいほど予測精度が上がります。通常のアプローチではサンプル数が増えると予測精度が下がるのですが、この手法では逆に予測精度が上がります。
2.予測モデルを再構築する必要がない。
 通常のアプローチでは、新規のサンプルが増えてくると予測性を確保するために予測モデルの再構築が必要です。この「テーラーメードモデリング」では予測モデルの再構築という考えはありません。なぜなら、予測モデルは予測する時に自動構築されるためです。
3.新規サンプルデータは、単にサンプルデータベースに登録するのみ。
 このアプローチでは、追加のサンプルデータがあっても、モデル構築用のサンプルデータと別個に管理する必要がありません。新規追加サンプルデータはそのまま現在用いているサンプルデータベースに登録するだけで完了しますので、メンテナンスの良さが際立ちます。
 以上のように、「テーラーメードモデリング」では、サンプル数が増えれば増えるほど予測精度が向上し、かつ新規サンプルデータは単にサンプルデータベースに追加するだけで予測モデルの再構築が無いというメンテナンスの良さが特徴です。

 株式会社インシリコデータは、この「テーラーメードモデリング」に関する総合的な支援コンサルタントを行います。


 テーラーメードモデリングによる予測の基本原理と構成

(注)特許に関しまして:ここで解説されるテーラーメードモデリングによる予測は全て特許申請済みです。より詳細な情報がほしい、あるいは本手法に興味がある方は、個々の特許に当たるか、株式会社インシリコデータに直接お問い合わせください


 現在構築中です。
★基本原理


★テーラーメード:クラス分類


★テーラーメード:

□特許および関連資料

2000年9月
2001年2月
2002年11月
2003年4月
2005年3月

フッターイメージ