數(shù)據(jù)分析師的基本工作流程:
1.定義問題
確定需要的問題,以及想得出的結(jié)論。需要考慮的選項有很多,要根據(jù)所在業(yè)務去判斷。常見的有:變化趨勢、用戶畫像、影響因素、歷史數(shù)據(jù)等。
2.數(shù)據(jù)獲取
數(shù)據(jù)獲取的方式有很多種:
一是直接從企業(yè)數(shù)據(jù)庫調(diào)取,需要SQL技能去完成數(shù)據(jù)提取等的數(shù)據(jù)庫管理工作。
二是獲取公開數(shù)據(jù),政府、企業(yè)、統(tǒng)計局等機構(gòu)有。
三是通過Python編寫網(wǎng)頁爬蟲。
3.數(shù)據(jù)預處理
對殘缺、重復等異常數(shù)據(jù)進行清洗。
4.數(shù)據(jù)分析與建模
這個部分需要了解基本的統(tǒng)計分析方法、數(shù)據(jù)挖掘算法,了解不同統(tǒng)計方法適用的場景和適合的問題。
5.數(shù)據(jù)可視化和分析報告撰寫
學習一款可視化工具,將數(shù)據(jù)通過可視化最直觀的展現(xiàn)出來。
數(shù)據(jù)分析入門需要掌握的技能有:
1. SQL(數(shù)據(jù)庫):
怎么從數(shù)據(jù)庫取數(shù)據(jù)?怎么取到自己想要的特定的數(shù)據(jù)?等這些問題就是你首要考慮的問題,而這些問題都是通過SQL解決的,所以SQL是數(shù)據(jù)分析的最基礎的技能。
2. excel
分析師更多的時候是在分析數(shù)據(jù),分析數(shù)據(jù)時需要把數(shù)據(jù)放到一個文件里,就是excel。
熟練excel常用公式,學會做數(shù)據(jù)透視表,什么數(shù)據(jù)畫什么圖等。
3.Python或者R的基礎:
必備項,也是加分項,在數(shù)據(jù)挖掘方向是必備項,語言相比較工具更加靈活也更加實用。
4.學習一個可視化工具
如果你想往更高層次發(fā)展,上面的東西頂多只占20%,剩下的80%則是業(yè)務理解能力,目標拆解能力,根據(jù)數(shù)據(jù)需求更多新技能的學習能力。
一個很好的學習網(wǎng)址:
https://www.cnblogs.com/nxld/p/6756492.html
聯(lián)系客服