GC-MSデータ(jdxファイル)のBRIX LITEへの登録事例
#メタデータ付き計測データファイルの登録例 #3次元データの登録例
背景
BRIX LITEは、カスタマイズが可能なプラットフォームです。お客様ごとに共通の「木の幹」を使用し、その上にお客様独自の「枝葉」を追加できる製品です。この柔軟性により、さまざまなニーズに対応することが可能です。
今回、材料実験のお客様向けに、GC-MS(ガスクロマトグラフ質量分析)のjdxファイルをBRIX LITEで読み込めるように機能を拡張しました。
このファイルには、測定条件などのメタデータとともに計測データが登録されています。また、複雑な構造を持つ3次元のデータです。
さらに、計測メーカーが異なるとファイルの書式にも違いがあります。
本記事では、そのようなデータをどのようにBRIX LITEに登録したかを説明します。
※尚、本記事で使用したデータは疑似データであり現実の計測データではありません。
使用したデータ
図1は、今回登録したGC-MSデータのイメージ図です。
実データは、もっと複雑な形をしていますので、あくまでもイメージ図です。
保持時間 (Retention Time)、質量電荷比 (M/Z)、相対強度 (Relative Abundance)からなる3軸のデータです。
図1.GC-MSデータのイメージ
図2は、このデータが格納されているjdxファイルの例です。
ファイルの最初の部分には様々な測定条件が記載されています。
##SCAN_NUMBERという項目で、保持時間毎にデータ区切られて表現されています。
このSCAN_NUMBERの保持時間 は、##Retention Timeに登録されています。
この保持時間に対する質量電荷比 (M/Z)と相対強度 (Relative Abundance)の値は、##XYDATA=(XY..XY)に登録されています。
この時のXとYが何を表すかは、##XUNIT=M/Z、##YUNIT=RELATIVE ABUNDANCEという形で定義されています。
ファイルを読み進めると、SCAN_NUMBERが2,3,4‥と増えていき、それぞれのSCAN_NUMBERで同様の形で3次元のデータが登録されています。
pythonなどから、REST APIでこのデータを取得することで3次元のグラフをプロットすることが出来ます。
図2.jdxファイル例
BRIX LITEへの登録例
図3は、このファイルをBRIX LITEに登録した時の登録例です。
保持時間毎にデータを格納しています。
計測名称は、「500℃_MS-RT5.288」のように試験条件と保持時間の組み合わせです。
前半の500℃は、jdxファイルには記載されていない試験条件を登録したものです。
後ろの番号(5.288)が保持時間を表しています。
計測「500℃_MS-RT5.288」の下には、「M/Z」と「RELATIVE ABUNDANCE」という二つのチャネルが登録されています。
これらは、画面右のCANVASにバーグラフとしてプロットすることが出来ます。
このような計測データが、保持時間分登録されています。
図3.BRIX LITEへのjdxファイルの登録例(計測データ)
ファイルに登録されていた実験条件は図4のように「Header_Data」として登録されています。
図4.BRIX LITEへのjdxファイルの登録例(試験条件)
計測器メーカーによるファイルの違い
同じjdxファイルでも計測器メーカーにより書き方が若干異なります。
図5は、計測器メーカーごとのファイル記述の違いを示した例です。
各ファイルで試験条件の部分に若干の違いがあります。
例えば、A社とB社を比較すると、B社では##TIMEが登録されていますがA社のファイルにはありません。
また、A社では##SPECTROMETER/DATA SYSTEMが登録されていますがB社ではありません。
C社を見ると、A社やB社に比べて測定条件データがかなり少ないです。
このように同じjdxファイルでも計測器メーカーやバージョンが異なると、ファイルの書き方が異なる場合があります。
今回は、これらの差分を吸収した形でデータを登録しています。
図5.計測器メーカーごとのjdxファイル記述の違い
まとめ
BRIX LITEは、多様なデータフォーマットや計測器メーカーごとの違いに対応しつつ、計測器データを効率的に登録・可視化できる柔軟性を持つプラットフォームです。
本記事では、3次元データやメタデータの登録方法を具体例とともに説明しました。
計測器メーカーごとに異なるファイルフォーマットの差異を吸収し、統一的なデータ管理を実現することで、データを活用しやすくなります。
製品紹介動画