Matrix Science
   
  ホーム  
 
 

Mascot と MOWSE の歴史

「二十日鼠と人間」の話

1993年(この年は独立・同時多発的に5本のPMF法に関する論文が発表され、まさにPMF法の当たり年でした)、Darryl Pappin (Imperial Cancer Research Fund, UK) と Alan Bleasby (SERC Daresbury Laboratory, UK) は、PMF法によってタンパク質を同定するプログラム MOWSE を開発し、発表しました[Pappin, 1993]。MOWSEMolecular Weight Search の略です。MOWSE の第一の特徴はインデックス化された配列データベースです。Alan Bleasby が開発した DELPHOS プログラム(OWL タンパク質データベースと並行して開発された構造化言語)を利用して配列データベースをインデックス化することにより、検索と配列データの抽出を高速化していました。第二の特徴はスコアリングアルゴリズムです。消化酵素による切断によって得られたペプチド郡の不均一な分布(non-uniform distribution)を初めて考慮しました。また、電子メールサーバを利用した検索投入の方法を採用していましたが、これも初めての試みでした。

その後、MOWSE II が発表されました 。MOWSE II はアミノ酸配列とアミノ酸構成による検索モードをサポートしていました。1996年の発表に先立ち、すでに1994年にはCGIプログラムとして動作する検索システムとして公開されていました。MOWSE II は高速に動作する検索エンジンの他にいくつかの優れた機能を持っていましたが、これらの優位性を実現するために使われていた配列データベースのインデックス化が弱点になり始めていました。新しい消化酵素を使いたい場合や、化学修飾・翻訳後修飾に対応するアミノ酸残基を定義する際には、配列データベースを再度インデックス化する必要があったためです。このことは、検索条件を変更しながら連続的に検索を実行するという将来的な要求には対応できないことを意味し、新たな仕組みを考案する必要がありました。

1997年、これまでの制限をなくし、より使いやすい検索システムにするために、MOWSEのシステム構造を改良することにしました。懸案であった配列データベース構造については、全面的にプログラムコードを書き換え、FASTA形式の配列データベースから直接に、しかもリアルタイムに質量を計算するように計画されました。1997年の終わり頃から、Darryl Pappin の研究グループにいた David Perkins が新しいプログラムコードの開発に着手しました。Davidは、DarrylやAlanと同様に、Leed大学の John Findlay の研究グループ出身で、OWLデータベース の開発を続けながら、タンパク質の配列解析や構造の可視化に関する新しい方法論を研究していました。


Darryl Pappin and David Perkins

David Perkins(左)と Darryl Pappin(右)、ICRF の門外で 1999 年に撮影


新しいプログラムコードは、最初からパラレルコンピューティングが実行できるように書かれました。また、MS/MSプロダクトイオン質量データを取り扱えるように、"ions" キーワードを追加しました。この機能追加は小さな項目でしたが、うまく動作することが確認され、後に強力なタンパク質同定手法となる「MS/MSイオンサーチ法」を実現する第一歩となりました(MS/MS質量データに対する検索手法はすでに John Yates と Jimmy Eng によって発表され[Eng, 1994]、Sequest 検索システムに採用されていました)。新しいプログラムコードは MOWSE III として完成し、ICRF内で利用されることになりました。MOWSE III は全ての検索手法、すなわちPMF、MS/MSフラグメントイオン検索法(MS/MS fragment ion search)、アミノ酸配列とアミノ酸構成による検索法(searches which combined mass data with amino acid sequence or composition)をサポートしており、また、あらゆる FASTA 形式の配列データベースに対して検索することができるように、必要な質量計算は直接に、しかもリアルタイムに実行することができました。さらに、実際の消化酵素切断特性に基づいた信頼性の高いスコアリングアルゴリズムが使用されていました。

1998年の中頃、ICRFは重要な決定を下しました。MOWSEを広く一般研究者に公開・配布するために、外部のバイオインフォマティクス企業と協業するというものです。弊社はその決定を受けて MOWSEの継続的な開発と配布に関して ICRFとライセンス契約を締結し、同時に、パブリックドメインとして配布されていた古いバージョンのMOWSEとの混同を避けるため、新しい名称として Mascot を採用しました。弊社は、SGI、SUN、DEC、Windows NTなどの様々なプラットフォームに「Mascot検索システム」を移植するとともに、全自動・大量処理を可能とするタンパク質同定システムとして再構築しました。1998年には、一般研究者が自由にMascot検索システムを利用できるように、公開 Mascot検索サイトをオープンしました。また、1999年にはMascot検索サイトをイントラ内に構築したいお客様向けに、Mascot検索システムの販売を開始しました。その後も弊社はICRFの協力の下でMascot検索システムの機能拡張に努めています。

 
 
© 2006 Matrix Science Ltd. and Matrix Science K. K.