【胜率统计说明】 考虑因素: (1)模式情况介绍 总共有三个模式:斗地主、排位和军八。斗地主分为普通场和至尊场,有地主(一人)和农民(两人)两种身份。排位有四号位置。军八总共有主公(一人)、忠臣(两人)、反贼(四人)和内奸(一人)四种身份。 (2)参考资料 主要参考为官方的胜率榜,但官方的胜率榜只有胜率排名情况,没有具体的数值。胜率榜信息情况如下:共有三种模式的胜率榜,其中斗地主(两种场次,两个身份总共四个榜),排位(四个位置对应四个榜),军八(四种身份分别对应四个胜率榜)。每个胜率榜都是显示本月对应模式胜率的前19名武将。 (3)模式加权 军八考虑到身份人数的不对等,根据分配的身份可能性参考加权如下:主:忠:反:内=0.125 : 0.25 : 0.5 : 0.125。 (4)时间因素 总共有14个月的胜率情况(从24年1月到25年2月),距离现在越近的榜和现在环境更加适配,所以参考价值更高。 然后是武将发布时间问题,有些武将是近期才被官方售发,所以之前的胜率榜没有他们的存在。 (5)武将价格 这次主要考虑宝珠武将性价比,所以每个武将都有对应的宝珠价格。 方法论: (1)赋分加权制: 由官方发布胜率榜,每个榜单对应19名排位,依次进行降序处理:赋予19分至1分。每个模式均有4条榜单,共计76条信息元。每个月份3种模式,对应228条信息元。14个月份累计,共计3192条信息元。 三个模式等比例加权; 斗地主场次(至尊和普通)、身份(地主和农民),排位座次(1至4号位)均未做额外加权处理; 军八考虑到身份人数的不对等,根据分配的身份可能性参考加权如下:主:忠:反:内=0.125 : 0.25 : 0.5 : 0.125。 【武将的出场率是加权所无法考量但是非常影响游戏体验的一个关键点,受限于官方代码不透明性和一系列暗箱操作,此条目考虑因素只得作罢】 (2)时间衰减因子: 公式:权重 = 0.93^(14 - n)。 逻辑:通过指数型缩减,确保14个月前数据权重仅剩 0.93^14 ≈ 0.34(34%),避免旧环境过度干扰,提高较近月份数值的参考价值。 e.g.单月得分=排名赋分*时间衰减因子 (3)动态窗格处理: 对于期间新发售武将:仅计算武将发布后的月份数据,避免因未发布时段拉低得分。 对于排位新增加和移除后武将:计算原则为收纳武将排位周期月份,后续排除后不再计算累计分。 【你也不知道那些被移出的武将后续是否会回归 & 最大限度收纳胜率榜数据;对于24年1月以前在排位但被移出的元老级武将,受限于数据源,红豆泥私密马赛!】 e.g. 神郭嘉于24年S7赛季被移出排位,分数累计仅计算24年S1-S6的累计分。 (4)数据归一化: 简单来说就是对总得分在时间上的平均化。一般来说,简单的数据累加除以分母月份的求和即可。重点在于时间衰减因子的引入和动态窗格的处理问题会产生巨大问题: 1.在累计赋分制分析中,未考虑动态窗格最直观影响是造成近期发售的武将总累计分数低,缺少原始积累并不是他们的锅; 2.而结合动态窗格会使得各月份得分受时间衰减的同时,各月份比例保持不变,这个过程中变量系数没有得到有效控制。进而放大远期月份的时间衰减因子效能,使常年在榜的老武将们吃亏。 所以,需要在动态窗格的分选下,加上时间衰减因子对月份的加权调整,这样能够完美解决上述连个问题。简单来说,就是在压缩武将月得分的基础上同样压缩月份时长,从而使得衰减因子对局部月份平均得分没有影响。但放眼整体,又实现了总体月份时长的压缩,从而确保了时间因子的衰减效能。 e.g. 实现了总平均得分到总归一得分的转化: 总平均得分 = Σ(单月得分) ÷ Σ(实际参与月份数) 加权月份数=1*时间衰减因子 总归一得分 = Σ(单月得分) ÷ Σ(加权月份数) (5)性价比评分: 由总归一得分值除以对应武将宝珠价格即可。 【目前是考虑所有能够用宝珠能够兑换的武将,你可能会想开放福袋、将魂、碎片、节钺令的宝珠武将,只按宝珠途径处理确实会降低其性价比,但从纯数据角度分析,这些获取放方式难以像宝珠 有如此强的通货性和精确性,算是自己的处理小私心吧】 原则总结: 1.客观化弱加权处理 2.时间衰减的归一化处理 3.官方胜率榜唯一数据源 局限: 数据源呈现形式:仅以赋分制产出,无法得到精确胜率及场次情况,在低排位中显著拉大赋分值差异,而高排位中差异降低; 仅呈现各位置和身份中的前19名武将:大量武将丢失本月信息源; 武将出场率加权无法实现:受限于官方代码源的不透明性; 模式身份和场别都尽可能地减少加权处理得出综合赋分:难以满足个性化想法及对特定模式身份场别的偏向以及需求。




换一换 
































