中文字幕理论片,69视频免费在线观看,亚洲成人app,国产1级毛片,刘涛最大尺度戏视频,欧美亚洲美女视频,2021韩国美女仙女屋vip视频

打開(kāi)APP
userphoto
未登錄

開(kāi)通VIP,暢享免費(fèi)電子書(shū)等14項(xiàng)超值服

開(kāi)通VIP
大型單細(xì)胞數(shù)據(jù)分析解決方案

男,

一個(gè)長(zhǎng)大了才會(huì)遇到的帥哥,

穩(wěn)健,瀟灑,大方,靠譜。

一段生信緣,一棵技能樹(shù)。

生信技能樹(shù)核心成員,單細(xì)胞天地特約撰稿人,簡(jiǎn)書(shū)創(chuàng)作者,單細(xì)胞數(shù)據(jù)科學(xué)家。


為什么要做大型單細(xì)胞數(shù)據(jù)分析

因?yàn)閱渭?xì)胞數(shù)據(jù)在呈指數(shù)增長(zhǎng),遇到大數(shù)據(jù)集只是早晚的問(wèn)題。曾經(jīng)我們困惑一個(gè)物種的基因組那么大,如果給很多物種都測(cè)基因組的話,拿什么來(lái)存儲(chǔ)這些數(shù)據(jù)?隨著單細(xì)胞技術(shù)的成熟,測(cè)序成本的下降,眼見(jiàn)單細(xì)胞數(shù)據(jù)通量將會(huì)呈現(xiàn)超指數(shù)增長(zhǎng)。在bulk時(shí)代所幾十例轉(zhuǎn)錄組會(huì)覺(jué)得已經(jīng)做了很多了,而單細(xì)胞時(shí)代少則幾千大則百萬(wàn)的數(shù)據(jù)量。我們不能怪時(shí)代太快,只能怪自己沒(méi)有做好心理準(zhǔn)備。

數(shù)據(jù)驅(qū)動(dòng)

如今在生命科學(xué)研究范式里,有了數(shù)據(jù)驅(qū)動(dòng)(data-driven)的選項(xiàng)。那么,什么是數(shù)據(jù)驅(qū)動(dòng)的呢?這一概念源于現(xiàn)代技術(shù)的進(jìn)步,不斷帶來(lái)大量系統(tǒng)、全面和深入的數(shù)據(jù)。當(dāng)范式改變時(shí),數(shù)據(jù)驅(qū)動(dòng)新的科學(xué)發(fā)現(xiàn),而不是相反。能夠利用現(xiàn)有數(shù)據(jù)的研究人員能夠挖掘出意想不到的、不可預(yù)測(cè)的關(guān)系和新知識(shí)。與此同時(shí),計(jì)算能力、機(jī)器學(xué)習(xí)、人工智能和其他可用來(lái)處理這些數(shù)據(jù)的技術(shù)已經(jīng)顯著提高,并為那些成功將數(shù)據(jù)與自己的工作聯(lián)系起來(lái)的人提供了巨大的機(jī)會(huì)。

大型單細(xì)胞數(shù)據(jù)分析,涉及到多個(gè)dataset的處理,它往往即是科學(xué)上的也是工程上的,所以有一些項(xiàng)目管理的原則是適用的。如大型單細(xì)胞數(shù)據(jù)分析的周期/交付結(jié)果 等。而我們關(guān)注的是數(shù)據(jù)分析,在單細(xì)胞數(shù)據(jù)科學(xué)中有哪些策略來(lái)應(yīng)對(duì)大型單細(xì)胞數(shù)據(jù)分析呢?通??梢圆捎玫募夹g(shù)有:

  1. 降維
    降維我們并不陌生,目前已經(jīng)廣泛地應(yīng)用到單細(xì)胞轉(zhuǎn)錄組的數(shù)據(jù)分析流程中了,如PCA。
  2. 并行化策略
    越來(lái)越多的分析工具開(kāi)始允許用戶(hù)適用多線程和并行化策略分析數(shù)據(jù),如scenic的python版本以及Seurat的幾個(gè)消耗資源的函數(shù)。
  3. downsample
    當(dāng)我們明確了單細(xì)胞數(shù)據(jù)分析的基本單位是細(xì)胞亞群而不是單個(gè)細(xì)胞的時(shí)候,在數(shù)據(jù)分析以及可視化的過(guò)程中應(yīng)用downsample在一個(gè)亞群內(nèi)隨機(jī)取子集的策略就會(huì)顯得很自然了。特別是在繪制熱圖時(shí)。
  4. pseudocell
    同樣地,在某細(xì)胞亞群內(nèi)隨機(jī)選取小子集做基因表達(dá)量的平均,也是一個(gè)數(shù)據(jù)縮減的方法。其核心依然是:保留亞群內(nèi)均和亞群間差異,也即單細(xì)胞數(shù)據(jù)分析的基本單位是細(xì)胞亞群而不是單個(gè)細(xì)胞。
  5. C++重寫(xiě)算法
    當(dāng)需要處理大型的矩陣時(shí),如矩陣計(jì)算,轉(zhuǎn)置等,不用底層語(yǔ)言往往會(huì)把內(nèi)存吃完,特別是當(dāng)我們的數(shù)據(jù)中有很多零的時(shí)候。這時(shí),會(huì)不會(huì)底層語(yǔ)言就顯得很重要了。
  6. 項(xiàng)目管理在數(shù)據(jù)分析中的應(yīng)用
    大型單細(xì)胞數(shù)據(jù)分析,其涉及到的dataset更多,分析周期也比一般的小圖譜要長(zhǎng),所以需要一些數(shù)據(jù)管理的經(jīng)驗(yàn)。

本文所說(shuō)大型單細(xì)胞其實(shí)只是細(xì)胞數(shù)比較多,20W+,而沒(méi)有涉及到單細(xì)胞多模態(tài)的數(shù)據(jù)分析。同時(shí),數(shù)據(jù)分析的另一個(gè)趨勢(shì):機(jī)器學(xué)習(xí),也沒(méi)有提到。這并不代表它們不重要。


References

[1] Svensson, V., Vento-Tormo, R. & Teichmann, S. Exponential scaling of single-cell RNA-seq in the past decade. Nat Protoc 13, 599–604 (2018).: https://doi.org/10.1038/nprot.2017.149
[2] https://www.scilifelab.se/data-driven

本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶(hù)發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊舉報(bào)
打開(kāi)APP,閱讀全文并永久保存 查看更多類(lèi)似文章
猜你喜歡
類(lèi)似文章
Nat Biotechnol|Spectra引領(lǐng)單細(xì)胞數(shù)據(jù)解析新模式,癌癥研究將受益
演講實(shí)錄丨桑文鋒:商業(yè)是一門(mén)技術(shù)
兩個(gè)樣品的10x單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)分析策略
bigSCale,大規(guī)模單細(xì)胞測(cè)序數(shù)據(jù)分析利器
【綜述】Nature Methods | 干貨!一文讀懂單細(xì)胞轉(zhuǎn)錄組分析的現(xiàn)狀和問(wèn)題!
前沿Perspective | 空間轉(zhuǎn)錄組數(shù)據(jù)分析方法最新進(jìn)展
更多類(lèi)似文章 >>
生活服務(wù)
熱點(diǎn)新聞
分享 收藏 導(dǎo)長(zhǎng)圖 關(guān)注 下載文章
綁定賬號(hào)成功
后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服