崗位招聘信息采集并做數(shù)據(jù)分析

目的:挖掘招聘平臺信息,并做簡單的數(shù)據(jù)分析案例以及數(shù)據(jù)使用方向。
挖掘平臺:boss直聘
檢索詞語:大數(shù)據(jù)、數(shù)據(jù)分析、數(shù)據(jù)采集、數(shù)據(jù)挖掘、用戶畫像
數(shù)據(jù)檢索級別:A級
數(shù)據(jù)檢索標(biāo)簽:標(biāo)題、公司位置、薪資水平、工作經(jīng)驗(yàn)、學(xué)歷要求、HR、HR崗位、公司名、公司領(lǐng)域、發(fā)展階段、公司人數(shù)、公司福利、招聘關(guān)鍵詞。

標(biāo)題:崗位熱度傾斜
位置:城市各區(qū)公司分布,對比
薪資:城市薪資水平,各區(qū)薪資對比
經(jīng)驗(yàn)-學(xué)歷:行業(yè)基礎(chǔ)在職門檻
HR:招聘人員男女比例
公司屬性:行業(yè)需求占比,不同發(fā)展階段需求比例
福利:熱招崗位基本福利水平
熱詞:就業(yè)擇業(yè)方向以及專業(yè)及技能考慮
采集結(jié)果:
數(shù)據(jù)條數(shù)1442

職位熱詞

在招崗位分布區(qū)域

城市薪資水平:
其中3.5k-5k占比%28排名第一,7.5K-9K占比%23排名第二,5.5K-7K為居中薪資水平占比%22。

城市招聘者HR性別比例,還是小姐姐多的喲!

行業(yè)崗位需求:
農(nóng)林牧漁排在首位相對來說是非常出乎意料的事情,當(dāng)然了三線城市HR的專業(yè)度也許會令人深思的。此外,針對數(shù)據(jù)的傾斜誤差行為并無太大的關(guān)系,數(shù)據(jù)服務(wù),計(jì)算機(jī)軟件,以及移動互聯(lián)網(wǎng)行業(yè)依舊是遙遙在前。

最后的職業(yè)熱度詞就不再展現(xiàn),并無太多的意義可言。
數(shù)據(jù)的采集挖掘——整理分類—— 清晰 階段——可視化
最為繁雜的要數(shù)整理分類以及清洗階段,在數(shù)據(jù)完整的情況下只要思維是絕對的清洗,剩下的只是不斷的重復(fù)操作而已。
以上的展現(xiàn)方式,因?yàn)閿?shù)據(jù)抽取的不完善性,以及并非完整的全年數(shù)據(jù),會存在不小的傾斜性行為,(甚至城市與城市之間,全國城市整體數(shù)據(jù)作為分析手段又是更加精確,只是更大的數(shù)據(jù)分析行為上升的單位背景又是一個層次,目前只針對一些普類公司去做數(shù)據(jù)分析是基本夠用的)當(dāng)然了在這里只為提供一些針對迷茫的小白思路。
最后,網(wǎng)絡(luò)并非法外之地,此文只針對技術(shù)可用性分析。