B-OSP EVEONLINE WIKI - プロジェクト・ディスカバリー:チュートリアル


チュートリアルの開始





私はアンドレア・コッサリッツァ博士。ケイル大学の免疫学教授です。

現在 ニューエデンは今までに見たことのないようなウイルスの脅威に直面しています。この新しいコロナウイルスは、人間とカプセラの両方を襲い、他のウイルスよりも急速に蔓延しているようであると同時に、犠牲者に様々な症状を引き起こし、戦闘を困難にしています。CONCORDの迅速な調整努力の甲斐もあって、私と同僚は新開発の ”Project Discovery”フローサイトメトリーシミュレーターを使って、この衰弱性の病原体の解読に取り組んでいます。我々は、データアナリストのチームに参加してくれる君のようなカプセラを求めています。

私たちは、急成長するサイトメトリストとしてのあなたのキャリアを開始し、この業界のツールについて簡単に説明します。その後、特定の方法論を紹介するために設計されたいくつかのトレーニングサンプルについて説明します。これらのウイルスの脅威が人間の免疫システムをどのように変化させるかを理解するために私たちを助けてください、そして私たちはあなたの努力に対してあなたに報酬を与えます。


チュートリアルをスキップする場合は「Skip Introduction」のボタンを押してください。
チュートリアルを開始する場合は「Continue」のボタンを押してください。

チュートリアルの成否は、その後の解析の成功率に影響しません。

チュートリアルを途中で閉じた場合は、再度開いた際に「Continue Tutorial」のボタンが出ます。これを押すと中断した時点から再開することができます。または左下の?マークからチュートリアルを再開してください。

チュートリアル

フローサイトメーター(Flow Cytomater)




先ほども述べたように、私たちのプロジェクトでは、コロナウイルスが免疫系にどのような影響を与えるかを理解することに主眼を置いています。この情報を得るために、フローサイトメーターと呼ばれる機械を利用しています。この装置を使用して、ウイルスの脅威が細胞の大きさや形などをどのように変化させるかを知ることができます。

フローサイトメーターは複数の部品で構成されていますが、プロセスは液体ポンプから始まります。 ここでは、流体ベースの研究用サンプル(主に血液)がマイクロ流体チップを通してポンプで送られます。この機械的な味方の心臓部であるマイクロ流体チップ(Micro Fluidic Chip)では、サンプルは狭いチャンネルを通って導かれ、装置の2番目のコンポーネントであるレーザーでスキャンされる際に細胞が1本のファイルラインを形成するようになっています。




プロセスのこのステップでは、マイクロ流体チップを通過する際に、シンプルで正確な光のビームがレーザーを介して細胞を通過します。各セルにレーザービームを照射することで、これらのセルを照らします。免疫系の構成要素が、フローサイトメーターの最終構成要素である光学サブシステム(Optics Subsystem)に対して、それらが保持する秘密を散乱させます。




この先進的なセンサーの配列の中では、これらの細胞の直接照明である前方散乱(Forward Scatter)、レーザービームによって引き起こされるオーラのようなものである側方散乱(Side Scatter)についてのデータが収集されます。






これら2つの散乱を組み合わせると、あなたがすぐに教わって分析することになるチャートが作成され、単一のサンプル内に存在する細胞の集まりの多様性についての洞察を与えてくれます。
ある集まりがどこで始まり、別の集まりがどこで終わるかを理解することは、我々の方法論的アプローチの基礎であり、新人としてのあなたの主要な仕事です。

始めましょうか?

チュートリアル用サンプルを解析





フローサイトメーターの知識を手にして、機械的な味方が生み出すデータをどのように解釈するかを学びながら進めていきましょう。
まず、フローサイトメトリーのデータがどのように表示されるのか、また、データを分析するためにラボのトレースツールをどのように利用するのかについて簡単なレッスンを行います。
しかし、フローサイトメトリーデータの解析に必要なスキルをすでに持っていると感じている方は、気軽に飛び込んでみてください。


チュートリアルをスキップする場合は「Skip Tutorial」のボタンを押してください。
チュートリアルを開始する場合は「Continue」のボタンを押してください。




チームへようこそ、カプセラ。
血液サンプルをフローサイトメーターに通してみると、左のグラフが出てきました。
各ドットはセルを表します。同じタイプの細胞は、しばしば私たちがクラスターと呼ぶものでグループ化されます。
あなたの課題はそのようなクラスターの境界を特定することです。そうすることで、このウイルスが私たちの免疫システムにどのような影響を与えるのかを理解することができます。




さて、この細胞群を「ゲーティング(Gating)」によって識別する方法を試してみましょう。
これを行うには、トレースツールを使って多角形を描きます。
青いボックスをクリックすると、最初のゲートのクラフトが始まります。

ここでは、シンプルに「ゲート」の作り方を学習します。青いボックスをクリックすると順番に点が描画され、線でつながっていきます。



繰り返してゲートを完成させてください。
重要なのは全てのゲートは閉じているということなので、必ず最後の点を開始した頂点に接続してください。



最初のゲートをうまく作ることができましたね。
ご覧のように、目標はできるだけ多くの細胞をキャプチャしながら、ユニークなクラスタを区切ることです。
それでも、クラスターの周りにはポリゴンをぴったりと配置するようにしましょう。
今すぐ分析を提出しましょう。

(クリックして送信する)





すばらしい! ニューエデンが直面しているウイルスの脅威との戦いを支援するための最初のステップを踏みだしました。
難易度を上げてトレーニングを進めましょう。

少し複雑なチュートリアル用サンプルを解析




インターフェースに新しいチャートが表示されるはずです。
ここでは2つの異なるクラスタがあります。クラスターを識別するために、以前と同じようにトレースツールを使ってクラスターを互いに「ゲート」します。
チャートをクリックして、最初のクラスターの周りにゲートを作り始めます。

ここでは自力でゲートを作成する必要があります。前回と同じようにクラスター(と思われる場所)の周囲にピンを打ちましょう。
なお、説明にはありませんがピンは最大で10個までしか打てないので、どんなに細かくしても10個目で始点に戻る(ゲートが作成される)ようにしましょう。戻らない場合は自動的に始点と終点が結ばれます。
作成したあとのピンやゲートは動かせるので、ある程度ざっくりと囲んだあとに調節することもできます。

なお、ここではどんなにゲート作成に失敗していてもクリアになります。



確かに最初のゲートほどきれいではありませんが、これで十分です。 今すぐ分析を送信しましょう。

(クリックして送信する)






よろしい。
チャートを見てみると、金色のラインとハイライトが入っているのがわかります。これを「ゴールドスタンダード」といいます。各サンプルで獲得できる報酬は、ゲートがこの基準にどれだけ近いかによって決まります。
そうは言っても、あなたの目標は各クラスターの境界を明確にすることであることを忘れないでください。そうすれば、熟慮された分析ができる可能性が高くなります。

ゴールドスタンダードは全てのケースで表示されるわけではありません。いわゆる精度の試験用の問題で表示されるものです。そのため、これが表示される問題は特に高い精度を出せるように感覚を研ぎ澄ましていく必要があります。




採点の時間です。最大のゲージはあなたの現在の提出物の精度を表し、他のものは比較のためのものです。
より正確な分析を目指すことで、チーム内での活躍が期待できます。

表示の内容は以下になっています。
Accuracyアキュラシー。今回の結果の正確さ
High Scoreハイスコア。他の人が出した最高の精度。
Parパー。正答と誤答の基準となる精度。
Averageアベレージ。今まで回答した人の精度の平均値。

かなり複雑なチュートリアル用サンプルを解析




もっと複雑なサンプルに挑戦してみてはいかがでしょうか。目標は、1つのクラスターが始まり、別のクラスターが終わる場所を明確にすることであることを忘れないでください。
ちょっとしたヒントですが、このチャートには5つのポリゴンがあるはずです。ゲートのマークが終わったら、必ず送信ボタンを押してください。

ヒントを元に5個のゲートを作成しましょう。なお、この問題は精度50%以上がクリア条件になっています。失敗するとリトライになるので、失敗時に表示されるスタンダードを覚えれば2回目には必ずクリアできます。

失敗例






成功例






多くの人はこれを見て「4つしかクラスターが無い」と思うことでしょう。これは予想でしかありませんが、一応仮説があります。今回のプロジェクトディスカバリーは「境界」を見つけるのが目的です。その観点で確認し、4つのクラスターをゲーティングした場合、右側の上と下との間に隙間ができます。5個目のクラスターは、この一見何もない”境界”にある密度の低いドットの集合体であると推測できるわけです。
この先もこのようなケースが出てきた際、ドットの数が少ないことを「クラスターではない」という判断に繋げないようにするためなのでしょう。

これからの課題に向けて、できる限りの準備をしてきました。
私はあなたがこのプログラムにおいて優秀であることを確信していますし、時間が与えられれば、あなたが私たちの最も優秀なデータアナリストのランクに参加することを期待しています。



ここでチュートリアルは終了し、この後はすぐに解析に移ります。



プロジェクト・ディスカバリー トップページに戻る
トップページに戻る