To view this email as a web page, click here.  日本語のWeb版はここをクリックしてください

newsletter banner

2018年10月号

検索条件設定の際に、基本的なことですが案外と見過ごされがちな内容についてご説明します。

「今月の論文」では、脳脊髄液(CSF)のショットガン解析に関する研究例をご紹介します。お客様が取り上げてほしい話題や研究論文がありましたらぜひご紹介ください。

「今月の小技」では、何らかの理由によりXML形式の質量データファイルが読み込めない時の対処方法についてご説明します。

Mascotニューズレターの バックナンバーはこのページ からご覧いただけます。日本語版は「Japanese」リンクをクリックしてください。また、Mascotニューズレターの内容に関してお気づきの点やご質問などありましたらご連絡ください。

 

今月のトピックス

検索の基本
今月の論文
今月の小技:mzML
 

見過ごされがちな検索の基本

弊社がインターネットに公開しているMascot Serverを利用しているお客様から、「芳しい検索結果が得られないのはなぜか」というご質問をいただくことがあります。検索内容を確認してみると次のような点に気をつけて検索条件を設定するとうまく行くケースが多々ありますので、改めてご説明いたします。(Mascotエキスパートのお客様におかれましては斜め読みいただきますようお願いいたします。)

  1. データベース: DBの種類やサイズ、あるいは統合検索で指定するDBの数に対してMascotのスコアは変わりませんが、期待値は変わりますので(検索空間が大きくなるとスコアは同じでも期待値は大きくなります)、意味もなく大きなDBやたくさんのDBを使うと優位なマッチングは得にくくなります。目的に合ったDBを選択し、検索を実行してください。

  2. コンタミに対応する質量スペクトル: 生物種が特定されているサンプル由来の質量データには消化酵素などのコンタミに由来する質量データも含まれていますので、その生物種に対応したDB以外にコンタミDBを使うことによりペプチドの誤同定が少なくなり、タンパク質の推定がより正確になります。

  3. 生物種: 生物種によっては登録されているタンパク質数が非常に少く、サンプル中に含まれるより多くのタンパク質を検出するという目的に合わない場合があります。たとえば、NCBIprotの「Hystricidae (Old World porcupines) 」に登録されているタンパク質は181件ですので、このような場合は検索対象を「Rodentia」などのより上位にある生物種を選択し、検索を実行してください。

  4. Garbage in garbage out: 質量データの質が悪い場合(意味のあるピークの数が少ない、ノイズピークの数が多いなど)は有意なマッチは期待できませんので、ピークリストデータをチェックしてください。

詳しい内容は ブログ にまとめましたのでご覧ください。

porcupine

今月の論文

Mascotニューズレターで取り上げてほしい話題や研究論文がありましたらぜひご紹介ください。また、Mascotニューズレターの内容に関してお気づきの点やご質問などありましたらご連絡ください。

 

Deep Dive on the Proteome of Human Cerebrospinal Fluid: A Valuable Data Resource for Biomarker Discovery and Missing Protein Identification

Charlotte Macron, Lydie Lane, Antonio Nunez Galindo, and Loic Dayon

J. Proteome Res., Article ASAP, published online August 20, 2018

Human cerebrospinal fluid is a window into the brain and a useful source for neurobiological biomarkers for clinical studies. In this paper, the authors have undertaken a comprehensive analysis of a commercial pool of "normal" CSF samples to deeply elucidate the proteome.

The pooled CSF sample was depleted of abundant proteins, labeled with tandem mass tags (TMT), and fractionated in 24 fractions using off-gel electrophoresis. Each fraction was analyzed independently with RP−LC tandem MS (MS/MS).

This shotgun proteomic analysis identified 20,689 peptides mapping on 3379 proteins, and is the largest CSF proteome published so far. Among the CSF proteins identified, 34% correspond to genes whose transcripts are highly expressed in brain according to the Human Protein Atlas. Additionally 26 "missing proteins", predicted by genomic or transcriptomic analyses, were also identified.

Thumbnail from featured publication

今月の小技:XMLデータファイル読み込みエラー対処法

XML形式の質量データファイル(RAWデータ、ピークリスト)に何か問題があり、Mascot ServerやMascot Distillerが読み込めなかった場合は「The key for identity constraint of element ‘mzML’ is not found.」などのエラーメッセージを出力して処理を停止しますが、メッセージの内容は具体的ではありませんので、(わたしが申し上げるのもナンですが)ほとんどの場合対処の手助けにはなりません。

MITライセンス として提供されている「XMLStarlet」プログラムはXMLファイルの中身をチェックし、より詳しいエラー情報を表示するXMLチェッカープログラムです。XML形式のファイル全般に対応しており、さまざまなOSで利用することができます。ここではWindows環境の下で、mzMLファイルに対する操作方法をご紹介します。

  • Sourceforgeの「XMLStarlet command line XML toolkit」のページの緑色の「Download」ボタンを押してください。

  • ダウンロードしたファイルを適当なフォルダ(ここでは「C:¥scratch」フォルダ)に展開してください(構成ファイル群は「C:¥scratch¥xmlstarlet-1.6.1」フォルダに格納されます)。

  • mzMLに対応する2つのスキーマファイル mzML1.1.0.xsd 及び mzML1.1.1_idx.xsd を「C:¥scratch¥xmlstarlet-1.6.1」フォルダにダウンロードしてください。

  • 「C:\scratch\data\problem.mzML」ファイルをチェックするために、コマンドプロンプトを起動して次コマンドを実行してください。

    cd "C:\scratch\xmlstarlet-1.6.1"
    xml.exe val --err --xsd mzML1.1.1_idx.xsd
       ..\data\problem.mzML 2> ..\data\errors.txt

エラーメッセージは「C:¥scratch¥data¥error.txt」ファイルに保存されます。内容をチェックしてください。

XML icon

お問い合せ

マトリックスサイエンス株式会社

〒110-0015 東京都台東区東上野1-6-10 ARTビル1F

info-jp@matrixscience.com

電話:03-5807-7895

ファクシミリ:03-5807-7896

 

Matrix Science logo

Matrix Science Ltd, 64 Baker Street, London W1U 7GB, UK
T +44 (0)20 7486 1050  F +44 (0)20 7224 1344  E info@matrixscience.com
 

View in a web browser Forward to a colleague Unsubscribe