このセクションでは発現データがネットワークデータとどう結合され生物学的に何を言えるのか、のシナリオの一つを示します。
最初に、あなたのデータの背景を示します。あなたは酵母の研究をしており、酵母の転写因子であるGal1、Gal4、Gal80遺伝子の研究をしているとします。あなたの発現の実験はすべて、これらの転写因子遺伝子の some pertubation を含むとします。Gal1、Gal4、Gal80は相互作用ネットワーク内で表され、酵母のローカスタグとしてそれぞれGal1はYBR020W、Gal4はYPL248C、Gal80はYML051Wとラベルされています。
ネットワークにはタンパク質ータンパク質(pp)相互作用とタンパク質ーDNA(pd)相互作用が含まれます。ここで、タンパク質ータンパク質相互作用を除外しタンパク質ーDNA相互作用に着目することとします。
- 1.ppにマッチするテキスト属性に関するエッジを選択するフィルターを作成します。詳細はfilters and editingチュートリアルを参照してください。
- 2.フィルターを適用します。362個のエッジのうち21個を選択します。
- 3.Editメニューにて、Delete Selected Nodes and Edgesを選択し、残ったエッジを見るためにグラフレイアウトを適用します。yFiles Organicレイアウトを適用するとネットワークは下図のようになります:
すべての3つの黒いノード(highly induced)はグラフの同じ領域にあることに注意してください。詳細を見るためにはグラフを拡大してください。
- 4.3つの黒いノードのうち、YPL248CとYOL051Wの2つのノードに注目してください。この2つのノードと近隣のノードを選択し、新しいネットワークにコピーしてください。これにより、そのノードを含む相互関係がわかりやすくなります。レイアウトやズームを工夫すると、この新しいネットワークは下記のようになります:
- 5.node attribute browserでの探索ののち、以下のことがわかるでしょう:
- すべての黒い3つのノードに関係する2つのノードはYOL051W (Gal11, a general transcription cofactor with many interactions)とYPL248C (Gal4)である。
- 両方のノードは発現の変化は小さく、統計的に優位なほどは変化していない。これは薄い色の円として表示されている。 These slight changes in expression suggest that the critical change affecting the black nodes might be somewhere else in the network, and not either of these nodes.
- YPL248CはYML051W (Gal80)と関係し、有意なレベルの抑制を示している:これは赤い四角で示されている。
- 一方、誘導を高いレベルで示すYPL248C遺伝子と関係するほとんどのノードYML051Wは有意な抑制の証拠を示していることに注意すること:これらは緑か黒の四角で示されている。
- 6.NCBIのウェブサイト( http://www.ncbi.nlm.nih.gov/ )に行き、Gene databaseでYPL248Cを検索してください。Gal4を含む結果が得られるでしょう。Gal4のリンクをクリックして詳細な情報を得てください。
- 7.Gal4の説明を読むと、それがGal80によって抑制を受ける転写因子であることがわかるでしょう。
- 8.Gal4の転写活性化はGal80によって抑制を受けることが、ここでの解析でわかります。そう、Gal80の抑制はGal4の転写活性化を促進します。Gal4の発現を通してGal4自身はそれほど変化を見せず、Gal4転写物はGal80が抑制されるときの活性転写因子と見なされる。これは、Gal4の近辺で強いアップレギュレーションを示すことの説明となっている。
やったぜ!ネットワーク解析と発現データは力強い組み合わせであり、ここでかなりの解析力を身につけましたね。おいしいコーヒーにでもどうぞありついてください。
コメントや提案があれば
cytoscape-discuss メーリングリストに投稿してください。
Return to Cytoscape
introductory tutorials.