男,
一個(gè)長(zhǎng)大了才會(huì)遇到的帥哥,
穩(wěn)健,瀟灑,大方,靠譜。
一段生信緣,一棵技能樹(shù)。
生信技能樹(shù)核心成員,單細(xì)胞天地特約撰稿人,簡(jiǎn)書(shū)創(chuàng)作者,單細(xì)胞數(shù)據(jù)科學(xué)家。
因?yàn)閱渭?xì)胞數(shù)據(jù)在呈指數(shù)增長(zhǎng),遇到大數(shù)據(jù)集只是早晚的問(wèn)題。曾經(jīng)我們困惑一個(gè)物種的基因組那么大,如果給很多物種都測(cè)基因組的話,拿什么來(lái)存儲(chǔ)這些數(shù)據(jù)?隨著單細(xì)胞技術(shù)的成熟,測(cè)序成本的下降,眼見(jiàn)單細(xì)胞數(shù)據(jù)通量將會(huì)呈現(xiàn)超指數(shù)增長(zhǎng)。在bulk時(shí)代所幾十例轉(zhuǎn)錄組會(huì)覺(jué)得已經(jīng)做了很多了,而單細(xì)胞時(shí)代少則幾千大則百萬(wàn)的數(shù)據(jù)量。我們不能怪時(shí)代太快,只能怪自己沒(méi)有做好心理準(zhǔn)備。
如今在生命科學(xué)研究范式里,有了數(shù)據(jù)驅(qū)動(dòng)(data-driven)的選項(xiàng)。那么,什么是數(shù)據(jù)驅(qū)動(dòng)的呢?這一概念源于現(xiàn)代技術(shù)的進(jìn)步,不斷帶來(lái)大量系統(tǒng)、全面和深入的數(shù)據(jù)。當(dāng)范式改變時(shí),數(shù)據(jù)驅(qū)動(dòng)新的科學(xué)發(fā)現(xiàn),而不是相反。能夠利用現(xiàn)有數(shù)據(jù)的研究人員能夠挖掘出意想不到的、不可預(yù)測(cè)的關(guān)系和新知識(shí)。與此同時(shí),計(jì)算能力、機(jī)器學(xué)習(xí)、人工智能和其他可用來(lái)處理這些數(shù)據(jù)的技術(shù)已經(jīng)顯著提高,并為那些成功將數(shù)據(jù)與自己的工作聯(lián)系起來(lái)的人提供了巨大的機(jī)會(huì)。
大型單細(xì)胞數(shù)據(jù)分析,涉及到多個(gè)dataset的處理,它往往即是科學(xué)上的也是工程上的,所以有一些項(xiàng)目管理的原則是適用的。如大型單細(xì)胞數(shù)據(jù)分析的周期/交付結(jié)果 等。而我們關(guān)注的是數(shù)據(jù)分析,在單細(xì)胞數(shù)據(jù)科學(xué)中有哪些策略來(lái)應(yīng)對(duì)大型單細(xì)胞數(shù)據(jù)分析呢?通??梢圆捎玫募夹g(shù)有:
本文所說(shuō)大型單細(xì)胞其實(shí)只是細(xì)胞數(shù)比較多,20W+,而沒(méi)有涉及到單細(xì)胞多模態(tài)的數(shù)據(jù)分析。同時(shí),數(shù)據(jù)分析的另一個(gè)趨勢(shì):機(jī)器學(xué)習(xí),也沒(méi)有提到。這并不代表它們不重要。
[1]
Svensson, V., Vento-Tormo, R. & Teichmann, S. Exponential scaling of single-cell RNA-seq in the past decade. Nat Protoc 13, 599–604 (2018).: https://doi.org/10.1038/nprot.2017.149[2]
https://www.scilifelab.se/data-driven
聯(lián)系客服