五月天青色头像情侣网名,国产亚洲av片在线观看18女人,黑人巨茎大战俄罗斯美女,扒下她的小内裤打屁股

歡迎光臨散文網 會員登陸 & 注冊

【python爬蟲】爬取bilibili動態(tài)下面的評論

2020-04-22 13:35 作者:來個羅芭姐姐雙排  | 我要投稿

話不多說先放源代碼(由于專欄沒有makdown功能只能直接放啦)

作用我都標注在旁邊了,藍色字體的部分意味著你可以自行修改


pn前面的分號不是我加的,是b站自己加的,用的時候記得自己刪掉
pn前面的分號不是我加的,是b站自己加的,用的時候記得自己刪掉

import re?
import urllib.request
import time

time.sleep(2)
comment_list = []? #創(chuàng)建空列表
for i in range(115): #動態(tài)下面的評論總共有115頁
? ?url = 'https://api.bilibili.com/x/v2/reply?jsonp=jsonp&pn='+str(i)+'&type=17&oid=378081993930152813&sort=2' #動態(tài)評論的接口(請大家不要惡意攻擊造成負荷)
? ?headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36' } #代理用戶進行瀏覽器偽裝
? ?html = urllib.request.Request(url = url,headers = headers)
? ?data = urllib.request.urlopen(html).read().decode('utf-8')
? ?comment = re.findall(r'"content":{"message":"(.*?)"',data,re.S) #用正則表達式扒所需要的評論內容獲取,只爬了評論內容
? ?print(len(comment)) #輸出每頁有多少個回復
? ?comment_list.extend(comment) #將評論內容一個個添加進空列表
print('評論已經爬取完成')
comment_txt = open('C:/Users/28051/Desktop/comment.txt','w',encoding='utf-8') #創(chuàng)建txt文本

for r in comment_list:

? ?comment_txt.write(r)?#寫入txt文本
comment_txt.close()

得到文本內容后你就可以自己進行文本分析啦,比如做詞頻分析啊,情感分析等等

有什么問題評論或者私信我,我會在第一時間內回復哦


API解析

https://api.bilibili.com/x/v2/reply?jsonp=jsonp&pn=[]&type=17&oid=[]&sort=[]

第一個位置填數(shù)字,表示多少頁

第二個位置填動態(tài)的oid

第三個位置,當填入0時,表示按照時間排序,當填入2時,表示按照熱度排序


ps:純技術分享,有引戰(zhàn)的我可是會刪評哦

【python爬蟲】爬取bilibili動態(tài)下面的評論的評論 (共 條)

分享到微博請遵守國家法律
大石桥市| 新和县| 西畴县| 顺昌县| 巨鹿县| 郸城县| 金山区| 嘉定区| 广灵县| 工布江达县| 静乐县| 仁布县| 南丰县| 吉水县| 凌源市| 茌平县| 荃湾区| 张家界市| 桐庐县| 南和县| 定兴县| 淄博市| 桦甸市| 临澧县| 涪陵区| 佛学| 牙克石市| 侯马市| 汽车| 酒泉市| 景德镇市| 上思县| 阳泉市| 洮南市| 大庆市| 双江| 黄山市| 四子王旗| 磴口县| 蒙阴县| 美姑县|