基于千萬級抽卡數(shù)據(jù)的補(bǔ)充統(tǒng)計

這篇專欄是對于用一千萬抽,揭示原神抽卡系統(tǒng)全部細(xì)節(jié)的補(bǔ)充,所用樣本稍有擴(kuò)充,并附上了一點我的思考。
小樣本極端情況偏多:或出于玩家的炫耀心理或倒苦水的需求,在總抽數(shù)小于200抽的樣本中極端情況顯著的多。而在總抽數(shù)稍多的樣本中此類現(xiàn)象微弱。
樣本接近末尾位置概率偏高:偶然“歐了”會使得玩家更傾向于提交自己的數(shù)據(jù)。而在不靠近末尾的位置概率正常。
統(tǒng)計不到“退坑”玩家:此前在NGA收集數(shù)據(jù)時發(fā)現(xiàn)常駐五星角色中迪盧克最多,七七最少。我的解釋是玩家在使用NGA后,抽到七七的玩家更傾向于退坑,而抽到迪盧克的玩家傾向于留下。這對整體的概率也有一定影響。但經(jīng)過后續(xù)數(shù)據(jù)收集和積累,選取總抽數(shù)大的玩家后這類影響變得非常輕微。
如果針對這些偏誤進(jìn)行數(shù)據(jù)篩除,能得到完美得多的擬合結(jié)果。此前的視頻中并沒有足夠時間說明篩除的原則,為了不引發(fā)誤解并沒有進(jìn)行篩除,但同樣可以得出和篩除后一致的結(jié)論。
對于“歐非程度”關(guān)于角色活動祈愿總五星數(shù)量的關(guān)系
對于角色活動祈愿,去除每個玩家的第一個五星,統(tǒng)計到恰好抽到最后一個五星的位置,計算其五星平均抽數(shù)并將其標(biāo)記在橫軸為五星數(shù),縱軸為五星平均抽數(shù)的圖上。圖中兩根線所圍區(qū)域為依據(jù)我的模型推算出來的包含95%玩家的區(qū)域。
為了保證繪圖效果,每個五星數(shù)下僅隨機(jī)抽取部分?jǐn)?shù)據(jù)繪圖。需要注意的是,因小樣本采樣偏誤,僅抽取少量五星的樣本偏極端,聚集在偏向90和偏向0的位置,不能作為判斷依據(jù)。

對于角色活動祈愿,去除每個玩家的第一個UP五星,統(tǒng)計到恰好抽到最后一個UP五星的位置,計算其UP五星平均抽數(shù)并將其標(biāo)記在橫軸為UP五星數(shù),縱軸為UP五星平均抽數(shù)的圖上。圖中兩根線所圍區(qū)域為依據(jù)我的模型推算出來的包含95%玩家的區(qū)域。
為了保證繪圖效果,每個UP五星數(shù)下僅隨機(jī)抽取部分?jǐn)?shù)據(jù)繪圖。需要注意的是,因小樣本采樣偏誤,僅抽取少量UP五星的樣本偏極端,聚集在偏向160、偏向80的位置,不能作為判斷依據(jù)。

對于角色活動祈愿“小保底歪率”統(tǒng)計
樣本數(shù)據(jù)中處于前一個五星為UP五星狀態(tài)下抽到的五星有72824個,其中抽到的36975個五星為UP五星,占比50.77%。應(yīng)該是次次都“歪了”的玩家更容易退坑而使得比例略高于50%。


計算抽了個常駐五星時,集齊
可以發(fā)現(xiàn),實際情況和理論情況并無顯著差別。
對于長時間不玩游戲再抽卡概率的統(tǒng)計
當(dāng)我聽到有傳言說長時間不玩游戲,游戲公司為吸引玩家回歸會調(diào)高概率的時候我是震驚的:什么游戲公司這么傻,直接多發(fā)一點回歸獎勵不是效果更好嗎?不管怎么說,由于此類理論流傳較廣,我也做一個簡單的統(tǒng)計(只代表原神的情況)。
當(dāng)此次抽卡時間相距上次抽卡時間超過n周時,統(tǒng)計此時開始接下來一周的抽卡情況,計入圖中第n周。統(tǒng)計時僅取處于1-73抽范圍概率未上升段的數(shù)據(jù)。由于樣本接近末尾位置概率偏高,導(dǎo)致無論無間隔還是間隔多周的概率都幾乎同比例上升。于是去除了每個玩家末尾270抽,所得統(tǒng)計圖如下。

雖然這樣的統(tǒng)計無法區(qū)分?jǐn)€抽的玩家和一段時間沒有玩的玩家,但數(shù)據(jù)里一定存在一段時間沒有玩的玩家,而這部分玩家并沒有引起顯著差異,應(yīng)該將長時間不玩游戲會使概率提高的理論排除。
很多朋友都對抽卡機(jī)制感興趣,但往往只流于言語而沒有去實踐。實際上研究抽卡機(jī)制并不難,也不需要多高深的數(shù)學(xué)知識和大量數(shù)據(jù)才可以研究,我在這里演示一下幾個簡單且容易實踐的例子。
輕松發(fā)現(xiàn)常駐祈愿“平穩(wěn)機(jī)制”
我找我的一位常駐祈愿抽的比較多的朋友要了他的抽卡記錄,一共357抽,抽到46個四星物品,01序列如下:
同時我隨便找了一個主播抽卡視頻,記錄其抽到常駐祈愿五星類別,得到了81個五星的數(shù)據(jù),01序列如下:
的寬平穩(wěn)序列,其延遲的自協(xié)方差如下:
對于完全隨機(jī)的01序列,這個值的期望為0,標(biāo)準(zhǔn)差為
為-0.105,而標(biāo)準(zhǔn)差為0.037,偏離很多。對于上列五星序列,為-0.1,而標(biāo)準(zhǔn)差為0.028,也偏離很多。這說明對于常駐祈愿有規(guī)律暗藏其中,同星級上一次抽到了角色,這次更傾向于抽到武器,反之亦然。
但事實上連這些簡易統(tǒng)計工具你都不需要,把四星角色和四星武器提取出來,在表格里標(biāo)記為不同的顏色,一眼就可以看出規(guī)律來。

?同樣,常駐祈愿五星的“平穩(wěn)機(jī)制”也很容易看出,每當(dāng)0或者1開始延伸的時候,總會被另一種打斷。

作為對比,這是一個每次的值和上次不相關(guān)的隨機(jī)01串的圖像。

我一直很迷惑的一點是,為什么很多做“抽卡攻略”的人連這么明顯的現(xiàn)象都沒有發(fā)現(xiàn),難道他們連自己的抽卡記錄都不看的嗎?
如果你去在線抽卡記錄統(tǒng)計站看過,你會發(fā)現(xiàn)在沒有「神鑄定軌」的武器活動祈愿中,如果同時UP了位于常駐祈愿中的五星武器和限定五星武器,則限定五星武器的數(shù)量總會比另一個UP五星武器更少一點。而對于UP了兩個位于常駐祈愿的物品的祈愿,兩個物品的數(shù)量都差不多。
于是可以提出一個假設(shè),當(dāng)75%的UP幾率下沒有抽到UP武器時,在常駐祈愿出現(xiàn)的五星武器中進(jìn)行選取,若此時UP武器也在常駐祈愿中,仍有可能被選取到,同時這個情況也算抽到了UP五星武器。針對三種類型的武器活動祈愿組合畫出狀態(tài)轉(zhuǎn)移圖如下:

有了假說后應(yīng)該看看實際情況是否符合假說。在這里并不需要自己去收集數(shù)據(jù),paimon.moe、genshin-wishes、非小酋等網(wǎng)站有現(xiàn)成的數(shù)據(jù),花十分鐘抄一下數(shù)據(jù)即可。和提出的假說對照如下。

可以看到這樣粗放的做法也可以基本驗證提出的假說,不需要花多少時間。
在這里,還可以將其推廣到角色活動祈愿中的一個特殊祈愿,1.3版本的刻晴祈愿??糖缂仁荱P角色,也在常駐祈愿中,也應(yīng)該存在類似的現(xiàn)象。可以看到實際情況和假說符合的很好。

這個假說還可以推廣到四星UP物品上,就這樣沒花多少功夫便確定了原神抽卡系統(tǒng)中的一處細(xì)節(jié)。
輕松推出原神概率提升規(guī)則
一年多前我做的視頻BV16i4y1L7Ne
思考
玩家總會質(zhì)疑游戲公司在抽卡概率上動手腳,歷史上的確也曾發(fā)生過這樣的惡性事件。玩家的質(zhì)疑當(dāng)然是合理的,但是大部分玩家往往將質(zhì)疑止步于在論壇上發(fā)帖宣泄情緒,或是借助一些臆想的理論抒發(fā)自己的不滿,而很少著力于用統(tǒng)計工具來一探究竟。這種情況非常正常:我是來玩游戲的,不是來做數(shù)學(xué)題的。本來抽卡沒抽到就很糟心了,還要去統(tǒng)計?
我的觀點是,在存在“抽卡”這種模式的前提下,玩家只有借助統(tǒng)計工具才可以捍衛(wèi)自己的權(quán)利。即使法規(guī)規(guī)定游戲服務(wù)提供者應(yīng)公布“抽卡”相關(guān)源代碼,但服務(wù)器上究竟跑的是什么仍不得而知。所有涉及到”抽卡“的游戲,既然選擇了使用這樣的盈利模式,就必須給玩家檢驗概率的手段,讓玩家能方便的導(dǎo)出和分享自己的抽卡記錄,對數(shù)據(jù)進(jìn)行匯總分析。
對于使用“抽卡”模式的游戲廠商,一定要保證概率公示值和實際值一致,即使是因為填錯表等原因?qū)е碌牡图壥д`也要盡量避免,重建玩家對于游戲廠商的信任不是一朝一夕之事。對于游戲行業(yè)從業(yè)者,研究在概率上做手腳在過去或許有利可圖,但在現(xiàn)在的環(huán)境下看,一個游戲能不能盈利取決于游戲品質(zhì),不研究如何提升游戲品質(zhì)而去鉆研如何欺詐消費者,這樣的從業(yè)者一定會在行業(yè)發(fā)展過程中被淘汰。對于質(zhì)疑游戲公司公示概率不實的玩家,一定不要說什么“游戲公司的手段很高明,就是做了手腳但你檢查不出來”這樣的話,游戲公司的員工也是人,不會比玩家更聰明,自己的權(quán)利要自己用統(tǒng)計工具捍衛(wèi)。