PUBG绝地求生游戏策略分析
PUBG绝地求生游戏策略分析

PUBG绝地求生游戏策略分析

目录

绝地求生,亦称PlayerUnknown’s Battlegrounds (PUBG) 是一款拥有数亿玩家的皇家大逃杀游戏。100 名玩家跳伞到一个岛上,寻找武器和装备来杀死他人,同时避免自己被杀。为了赢得第一名,玩家根据他们的经验并使用多种策略。我们的团队旨在通过从超过 720K 场比赛中提取死亡率和不同策略之间的关系来帮助玩家指定决策并在比赛中获得更好的排名。

数据准备

为了提供清晰的 PUBG 比赛策略并提出适当的建议,在这个项目中,我们使用了 PUBG 比赛死亡统计的数据集。它是一个公开可用的数据集并且可以在Kaggle上找到,包含超过 720K 的PUBG 竞争比赛,也可从游戏跟踪网站pubg.op.gg中提取。

我们没有使用原始官方网站提供的所有数据文件,而是主要关注游戏匹配机制中 ERANGEL 地图的 5 个子数据集,其中记录了发生在 720K 匹配中 80% 以上的玩家击杀。由于数据集非常庞大(每个.csv文件 2GB),考虑到计算机性能,我们只取了上面提到的 5 个子数据集之一,其中包含大约 120K 的匹配记录。

在分析之前,我们通过以下主要步骤清理了数据集:

  • 排除缺失重要分析值指标的记录。
  • 删除极大可能由玩家使用作弊程序而产生的记录。
  • 只取击杀事件位置发生在0到80万数值之间的记录,以此更好得点对点匹配 ERANGEL 地图。

跳伞落地点分析

比赛开始后,玩家们将出发前往不同的地方。一般来说,有两种主要策略:第一种策略,玩家痴迷于拥有良好品质和繁多数量武器以及盔甲的高价值场所。但是那些高价值地点也伴随着很高的风险,因为它也吸引着其他相同目的玩家,你总是可以听到从那里传来的枪声。

下图是PUBG官方提供的高价值武器分布图。那些高价值区也是我们通常所说的市区,因为很多楼房紧挨着,地形复杂多巷战。

另一方面,其他玩家会选择相对更安全的地方(我们也称之为野区)。尽管武器和盔甲的质量通常很低,但那些地方相对于市区在地图上的面积占比更大,因此几乎很少能遇到其他玩家与你降落在相同位置的情况。

通过官方的数据集,我们试图窥探这两种策略的区别,并在这些玩家离开飞机并打开降落伞之前,给他们一些有用的建议。

首先,我们需要明确市区和野区。根据官方武器图和游戏常识,我们定义了7个区域为市区,分别是:

  • Georgopol
  • Yasnaya Polyana
  • Rozhok
  • School
  • Pochinki
  • Mylta
  • Military Base

定义这些区域后,现在我们只需要知道玩家离开飞机后具体降落的位置。

但是很遗憾,源数据集并不包含此信息。在数据集中(如下图),它只提供了当击杀另一名玩家时 杀手和受害者各自的位置、击杀的具体时间和他们最终在游戏中的总体排名等。

与此同时,通过网上搜索我们发现蓝色区域在 第12 分钟时到达了第一个白色圆圈(第一次缩圈)。

根据以上信息,如果我们限制第二个蓝区到来之前的时间,我们可以使用击杀事件来预测着陆位置。也就是说,如果击杀事件只是在比赛开始几分钟后发生,那么凶手或受害者的位置很有可能在他们降落的地方旁边。所以我们给出的方案是:

  1. 通过算法计算7个市区到击杀地点的距离,以此判断玩家跳伞后是否选择城区作为落地点
  2. 将上述结果匹配玩家排名的数据

以此我们得到了 4 个值:

  • chengqu_t5 玩家登陆市区并排名前 5 
  •  chengqu_b 玩家登陆市区但排名不在前5 
  •  yequ_t5 玩家登陆野外并排名前 5 
  •  yequ_b 玩家登陆野外但排名不在前5 

若你打算亲自运行R代码测试结果,你可能需要等待一些时间,因为清理过后的数据依然很大、包含太多数据记录。但在得到结果后,我们可以使用卡方检验来查看两种策略之间是否真的存在差异。

  • Ho:跳伞落地点与玩家最终排名并无关联
  • H1:跳伞落地点与玩家最终排名有关联

卡方检验的输出如下图所示:

登陆市区更有可能排名前五

p 值小于 0.05,我们将拒绝原假设Ho,这意味着我们得出初步结论:即两种策略之间存在差异。经过后期计算,降落在城区有9.5%的可能性进入前5名,而降落野区只有8.5%的可能性。

我们认为这个结果是合理的。市区虽然有风险,但同时也拥有更好的盔甲和武器以增加生存(交战受伤受伤但不及死亡)的可能性。同时,因为在常识中城区往往意味着激烈的交战,如果大家都不选择城区,此时玩家选择在市区着落,他可以无忧无虑的找到更好的一套装备然后安全离开,大大提高后期的生存概率,这也是一种很好的生存策略。

如果你降落在荒野,你可以在游戏开始时生存,但是你也不得不移动到其他地方寻找盔甲和武器才能生存,因为野区往往无法满足一套好装备的要求。在这个转移躲藏点的期间,你很可能被在那里守候已久的其他玩家杀死。同时,如果你的配件不够好,遇到那些装备精良、枪械配件齐全从市区出来的玩家,他们的枪比你更容易控制,这意味着很容易被他们杀死。

尽管结果的差异是 1%,但我们希望这或许能给您一些选择着陆点的建议。毕竟,富贵险中求。

最终蓝区位置预测

从着陆中过程中幸存下来的PUBG玩家在追求第一名的过程中将面临很多的不稳定情况。“蓝色区域”是游戏的核心功能,它限制了玩家在游戏中的空间,而“求生圈”是玩家必须停留的区域。如果存在于蓝色区域内,玩家每秒都会受到伤害,如下图所示。随着游戏的进行,这会迫使玩家彼此靠近,以加快游戏速度。因此,为了保住生存,玩家必须在游戏过程中明智地制定躲藏策略并消灭因此遭遇的敌人,但前提是他们应该留在游戏区域直到比赛结束。

求生圈共有 8 个圆圈,第 8 个是最后一个圆圈,详情如图所示。在比赛过程中,游戏区域的半径逐渐减小,使得地图的可玩区域越来越小。因此,玩家在进行战斗之前对多个游戏缩圈区域进行预测至关重要。如果玩家未能做出正确的预测、选择了错误的高风险区域,他们将陷入困境甚至输掉比赛。在这种情况下,蓝圈分析可以为玩家提前预测圈的最终位置并提供有用的建议,从而为在本次比赛中成功生存和提高排名提供全面、科学的策略

数据准备

使用当前数据集,我们只将杀手和受害者的坐标位置保持在 0 到 800000 之间,去除所有其他无效异常值。使用 R studio,我们安装和加载所需的包,并设置工作目录来管理文件位置。接下来,我们读取 csv 文件并创建一个名为“df_pubg”的数据框。由于最后一圈会提供最重要的生存指南,表明最后的替换,我们只关注最后一圈的射击分布。在这种情况下,我们根据上图所示的“圈子”细节将游戏时间转换为 8 个圈子类别。

求生圈的概率密度分布

首先,我们使用带有轴对齐二元法线核的二维核密度估计(kde2d 函数),在方形网格上进行评估,根据击杀者的位置估计游戏区域位置的概率密度,表示高概率的生存位置。如下图所示,我们可以清楚地看到玩家生存的概率密度分布,从而得出可能的求生圈位置,但这仅作为参考并不能十足确信。

为了更好地理解真实地图中杀手位置密度分布背后的含义,也就是最终的求生圈,我们尝试根据 pubg ERANGEL 地图背景绘制热图。因此,我们将ERANGEL 导入到 R studio。接下来,我们使用 imager 加载 ERANGEL 地图进行分析。

我们使用杀手在 x 轴和 y 轴上的位置来绘制第 8 个圈中杀手人口密度的分布,因为我们认为杀手的位置高度代表了可能的高频率生存位置,因此是最终的游戏区位置。在绘制图形之前,我们使用“options(scipen=999)”以固定符号打印数值,以帮助我们很好地表示 x 和 y 轴值。此外,对绘图设置进行了多项修改,以提供清晰的可视化效果,如下所示。最终,我们在图中绘制了生存杀手在最终游戏区域的分布,这显示了玩家最安全的隐藏位置。

蓝区预测分析

从上图结果的分布情况我们可以发现,多个区域都发生了大量的激烈战斗,这些区域极有可能成为玩家最终的游戏区位置。因此凭借它可以帮助玩家提前做出更好的跑圈决定。

此外,红色集中度较高的地方拥有更多的生存玩家。很明显,存活人数最多的前 2 个区域是“Yasnaya Polyana”和“Pochinki”。这种现象主要是由于游乐区圆的半径逐渐减小,迫使它们聚集在这些区域。

接下来,米尔塔、加卡、罗兹诺克、索斯诺夫卡军事基地也看到了激烈而频繁的冲突,很多人聚集到这些地区。原因可能是更多的避难所让他们躲起来。事与愿违的是这些地方也变成了充满危险和死亡的危险地带。

经过分析,后期玩家高度聚集的区域极是有可能为最终的求生圈位置,它们分别是Yasnaya Polyana和Pochinki。

武器分析

很多PUBG玩家在刚进入一个房间里都会发现不同种类的枪,此时他们都会面临选择武器的困境。虽然他们可以携带两把主武器和一把副武器,但遇到其他玩家并交战时往往只能使用一两把枪。因此,他们在选择武器时主要关心的是哪种武器会让他们在特定情况下拥有更高的生存可能性。通过分析数据集,我们试图在玩家选择武器时根据事实为他们找到更好的选择。

以往别人的分析只尝试建立模型并预测排名,很多分析都没有为普通玩家关心的问题提供方案,新手玩家往往关注的是如何最大限度地提高生存性(提高生存排名)以及进行更多击杀。在这个项目中,无论是新手还是高手,无论是求生还是追求排名,我们都会尽最大努力为所有玩家找到有贡献的成果。

数据理解和准备

安装和加载包后,我们将工作目录设置为源文件位置,然后读取 csv 数据并形成一个名为“my_data_orig”的表。

我们排除了“killed_by”中与武器无关的几种死因记录。例如,玩家从高处坠落、被汽车或摩托车碾压击杀,或者在红/蓝区域钟死亡。此外,我们已经知道所有记录都是在地图“ERANGEL”上创建的。由于我们要进行武器分析,因此我们将重点关注“killed_by”、“killer_name”、“killer_placement”、“match_id”和“time”。

我们通过从原始数据中选择一个子集来创建一个新的数据表“my_data”,选择所有非武器造成的死亡记录和上述 5 列,最终我们得到了包含 7,629,499 条记录的数据表,也就是我们将在以下分析中使用的表。

当我们查看摘要时,我们发现killer_placement和时间的范围是[1, 99]和[58, 2374](秒)

然后我们为这两个变量创建直方图。从“不同时间的击杀”可以看出,在前期,从100秒到500秒左右,出现了击杀峰值。此外,100 秒前和 1800 秒后的击杀次数相对较少。 这是合理的,因为最初10秒玩家在飞机上,然后在他们还在空中跳跃时,还没有在地面上,所以更难杀死。但他们落地后,游戏开始时人口最多,一些新手更容易死。至于1800之后的时间,剩下的玩家很少,那么击杀肯定会减少。

然后我们来到“杀戮位置”,我们发现似乎排名较高的玩家往往也有更多的击杀数

每场比赛的杀戮

由于数据记录了每场击杀的信息,所以我们需要统计每场比赛的击杀数。首先在“my_data”中添加一个名为“count”的1列,以供进一步使用。然后使用“聚合”按匹配 id 按组计算击杀数。

在记录的这 118838 场比赛中,每场比赛中由武器造成的击杀从 6 到 95 不等,直方图显示最有可能出现 60-65 击杀。

不同时期每种武器的击杀数

绝地求生游戏一局有8个圈,“start_time”中记录了游戏开始时间和8个圈的数据。我们主要分析游戏的三个阶段,前期、中期和后期。前期定义为前 3 个圈,中期定义为接下来的 3 个圈,后期定义为最后 2 个圈。

我们将分析不同阶段和整个游戏中每种武器的击杀情况通过划分时间并分别分析并制作了“my_data”的三个子集。1300 秒之前造成的杀戮分为前期(kam_pro),1300 和之后但 1760之前造成的杀戮分为中期(kam_meta),1760 和之后属于后期(kam_ana)。

我们计算每种武器在不同阶段的击杀数并除以匹配总数(118838),然后得到每种武器的击杀数平均值(pro/meta/ana_kill_mean),然后使用“full_join”连接三个表,join使用mean而不是sum,创建一个名为“kam_ft”的新表和一个新变量“total_kill_mean”,表示整个游戏在不同比赛中的平均击杀数。

不同阶段总击杀中,每种武器击杀百分比的新变量的创建是因为不同阶段的总击杀数不同,直接比较每种武器在不同阶段的击杀数平均值是不合适的,最终表格如图所示。

我们开始分析数据并可视化结果。在检查每个时期和整个游戏的不同武器造成的死亡百分比后,列出导致死亡最多的前 5 种武器,创建直方图和表格以更好地观察结果。

前期和后期是有区别的,这些数字和表格记录了排名前五的杀伤力武器,在中期和后期,前 5 种武器的类别和排名都相同。不过前期是“UMP9”而不是“Kar98k”进入前5,总体排名也有所不同。

此外,在中期和后期,M416导致的死亡比例高达25%左右,这意味着近四分之一的死亡病例是由M416造成的,而前期M416的占比仅排名第二。

根据武器资料表,中后期最好使用Kar98k之类的狙击步枪,前期不推荐使用。M416在杀戮方面非常有用,尤其是在中后期。

为了进一步探索不同时期的武器情况,我们创建了一个条形图来比较死亡比例。由于有太多种类的武器使得击杀百分比的概述难以阅读,我们仅选择了一部分并将坐标轴放大到极端位置。

由“S686”、“S1987”和“UMP9”引起的死亡占所有前期死亡的比例高于中期和后期。“Mini14”和“Kar98k”正好相反。根据武器信息(摘录),前 3 种武器的平均杀伤距离较短,而后 2 种武器的平均杀伤距离较大。所以前期推荐前一类兵器,后期推荐后一类兵器。

杀死每一场顶级武器

然后我们通过将“killed_by”和“match_id”分组并计算击杀数,计算每场比赛(118838场比赛)中每种武器造成的总死亡人数,用0填充NA。选择总死亡人数排名前3的武器并创建一个新的箱线图.

计算所有三种武器的总体平均值的置信区间,三个区间似乎都没有与其他区间重叠。

同时,我们做一个假设检验: 

  • H0:三种武器的所有人口均值相等
  • H1:至少有一个总体平均值不同。

我们首先进行方差分析,但发现它不是正态分布的,然后我们进行 Kruskal-Wallis 检验和多重成对比较。

由于 p 值小于 0.01,至少有一个总体平均值是不同的,我们拒绝原假设H0并得出结论。

M416 的总体平均数最大,M16A4 次之,SCARL 最小。也就是说,

如果玩家的目标是获得更多击杀,则建议在整个游戏中使用 M416。

武器和最终排名

以上我们对武器的分析都集中在击杀上,现在我们将探讨使用不同武器的最终排名是否存在差异。

我们删除了每场比赛中由同一杀手和同一武器制作的死亡记录的副本,然后通过识别特定武器名称来制作几个子集,创建使用不同武器的杀手位置的直方图,通过分析下图我们可以看到:

使用 M416 的杀手获得更高排名的可能性更大。UMP9 也表现不错,但在 25-20 左右的排名似乎更多。使用 P92 和 S1897 的玩家大多排名在 20-25 之间(靠后)。

结论与建议

综上所述,我们通过对超过 12 万场比赛的死亡率与 3 种不同策略之间的关系进行分析,最终找出了在比赛中生存概率较高的玩家所采取的策略。他们是:

  1. 降落在市中心地区更有可能进入前 5 名。
  2. 最终蓝色区域中最有可能的 3 个位置分别是 Yasnaya Polyana 和 Pochinki。
  3. 与最激烈和最冲突的游戏区:Yasnaya Polyana 和 Pochinki,玩家在下一个圈时如果可以务必避免进入这些激烈的射击区域。
  4. 推荐使用 M416、M16A4、SCAR-L 和 AKM。在前 3 个求生圈内,UMP9 也表现良好,后期我们更推荐Kar98k。

由于官方机密信息和数据的保护,我们的分析也存在一些限制和不足。如果我们的项目也可以引入其他相关的数据集,它将提高结果的准确性和分析的多样性。例如,我们还可以研究不同天气条件下的生存策略、不同战斗模式下的策略,包括第一人称视角和第三人称视角等。

希望我们的分析能帮助到想接触这款游戏的你,也谢谢你能阅读到这里。

发表回复

您的电子邮箱地址不会被公开。