想轉(zhuǎn)行學(xué)大數(shù)據(jù)分析應(yīng)該怎么做

? ? 想往大數(shù)據(jù)方法發(fā)展,首先得確認(rèn)你在轉(zhuǎn)之前是一個(gè)純小白,還是一個(gè)已經(jīng)具備一定開發(fā)經(jīng)驗(yàn)的程序員.如果是有一定經(jīng)驗(yàn)的,相對(duì)來(lái)說(shuō)會(huì)比較容易些,因?yàn)檎Z(yǔ)言都是相通的.對(duì)于純小白,首先要做好充足的思想準(zhǔn)備,學(xué)習(xí)編程本就是一件枯燥的事情,很磨練心智的.其次如果自學(xué)會(huì)比較難,比較慢,最好找個(gè)地方進(jìn)行快速的學(xué)習(xí)(個(gè)人建議).不過(guò)對(duì)于大數(shù)據(jù)開發(fā)未來(lái)的前景還是不錯(cuò)的,包括就業(yè)前景,就業(yè)薪資,所以如果你想以后將大數(shù)據(jù)作為長(zhǎng)期從事的工作,還是可以的.
? ? 下面培訓(xùn)無(wú)憂網(wǎng)介紹一些大數(shù)據(jù)相關(guān)的,希望對(duì)你有用:
? ? 一大數(shù)據(jù)相關(guān)工作介紹
? ? 大數(shù)據(jù)方向的工作目前主要分為三個(gè)主要方向:
? ? 1.大數(shù)據(jù)工程師
? ? 2.數(shù)據(jù)分析師
? ? 3.數(shù)據(jù)倉(cāng)庫(kù)(數(shù)倉(cāng))
? ? 4.其他(數(shù)據(jù)挖掘等)
? ? 二必須掌握的技能20條(按照這個(gè)順序進(jìn)行學(xué)習(xí))
? ? 1.Java基礎(chǔ)
? ? 2.Linux基本操作
? ? 3.Hadoop(HDFS+MapReduce+Yarn)
? ? 4.Hive(Hql基本操作和原理理解)
? ? 5.Hbase(JavaAPI操作+Phoenix)
? ? 6.Flume/Sqoop(數(shù)據(jù)采集/傳輸工具)
? ? 7.Kafka(分布式總線系統(tǒng))
? ? 8.Storm(分布式的實(shí)時(shí)計(jì)算框架)
? ? 9.Scala(編程語(yǔ)言,用于Spark開發(fā))
? ? 10.Redis(非關(guān)系型數(shù)據(jù)庫(kù))
? ? 11.SparkCore(主要數(shù)據(jù)清洗,分析)
? ? 12.SparkSQL(相關(guān)數(shù)據(jù)分析)
? ? 13.SparkStreaming(實(shí)時(shí)統(tǒng)計(jì)分析)
? ? 14.Spark內(nèi)核編碼
? ? 15.Flink(開源流式框架,進(jìn)行實(shí)時(shí)統(tǒng)計(jì)分析)
? ? 16.ElasticSearch(搜索引擎,進(jìn)行數(shù)據(jù)存儲(chǔ)分析)
? ? 17.Logstash(動(dòng)態(tài)地采集,轉(zhuǎn)換和傳輸數(shù)據(jù))
? ? 18.Kibana(可視化監(jiān)控管理及分析)
? ? 19.Mongodb(非關(guān)系型數(shù)據(jù)庫(kù))
? ? 20.輔助小工具(Oozie/Hue/azkaban等)
? ? 三高級(jí)技能9條
? ? 1.機(jī)器學(xué)習(xí)算法以及mahout庫(kù)加MLlib
? ? 3.Lambda架構(gòu)
? ? 4.Kappa架構(gòu)
? ? 5.Kylin(數(shù)據(jù)預(yù)處理工具)
? ? 6.Alluxio(數(shù)據(jù)存儲(chǔ))
? ? 7.Python(輔助數(shù)據(jù)分析)
? ? 8.可視化工具(superset/vue/grah)
? ? 9.Kudu(分布式數(shù)據(jù)存儲(chǔ))