奥塔维亚诺海伦*
考虑来自不同研究机构的数据具有增加信息量的优点,但增加了波动性
对民众选举偏好的调查表明,如果当时举行选举会发生什么情况。 然而,为了以更一般的方式评估研究结果,特别是关于它们可能揭示的可能趋势,必须采取一些预防措施。 让我们根据各组织在 2022 年 XNUMX 月至 XNUMX 年 XNUMX 月进行的总统选举民意调查中对四位主要候选人的偏好结果来举例说明,[1] 因此,在党改变之前,石板的定义和候选人的合并,虽然不是确定的,但发生在 XNUMX 月初的事情。
要分析的数据显示在图 1 中。纵坐标(轴 y) 在图 1 中的每个点显示了在对应于横坐标(轴)的日期进行的调查中所咨询的人表达的偏好 x).[2] 当在同一调查中考虑了不止一组候选人时(通常被媒体称为场景),不同的结果代表在同一个横坐标上。
图1 – 选举结果; 最受青睐的候选人.
通常,民意调查结果与“误差幅度”的粗略估计一起呈现,通常约为 2% 或 3%。 这种“误差范围”意味着,如果调查是在同一天进行的,使用相同的程序并针对具有相同概况(年龄、性别、教育、收入、地理区域、宗教等)的人,则结果在该范围内可能会有所不同。 这些“误差范围”仅具有统计性质,也就是说,它们不包括由于所采用的方法或关于投票人口概况的假设而产生的不确定性。 此外,这些差额对有良好偏好的候选人有效; 对于偏好率较低的候选人,“误差幅度”较小,如后所述。
因此,如果同一家公司进行的两次连续调查之间的差异低于误差范围,我们就无法可靠且真实地假设选民的偏好发生了变化。 只有至少满足以下条件之一,才能得出该结论:变异大于“误差范围”; 同一公司进行的新调查再次出现同一方向的变化; 另一家公司在同一日期进行的调查也出现了同样的变化。
通常的 2% 或 3% 是对误差幅度的粗略估计。 事实上,这个差额取决于候选人的偏好程度。 例如,从图 1 中可以看出,虽然在此期间两位最高评价的可能候选人(卢拉和博尔索纳罗)的最大和最小偏好分别在 13% 和 12% 的范围内变化,但对候选人 Ciro 和 Moro 在更小的范围内变化,分别为 5% 和 4%。 大约 2% 到 3% 的误差幅度对于具有高偏好的候选人是有效的。
通常,候选人的支持率越接近 50%,“误差范围”就越大。 因此,对候选人的偏好有 3% 的变化,例如,从 50% 到 53%,可能没有任何意义,而低评级候选人的相同变化,例如,从 5% 到 8%,可能非常重要.
在比较不同公司的调查时,范围(“误差范围”)可能会更大,如下所述。
除了纯粹的随机变化之外,由于采用了不同的方法和关于将投票的人口概况的假设(如何按收入、受教育程度、年龄、国家地区等分布),结果也可能存在差异..)。
例如,在图 1 所示的数据中,有两种类型的调查:一种是亲自调查,一种是电话调查。 这两个结果之间的差异非常显着。 在通过电话进行的调查中,候选人卢拉获得的选票平均比亲自进行的调查少 2% 到 3%。 至于排在第二位的候选人,情况正好相反,电话咨询得票多于面对面咨询。
在比较不同研究公司发布的结果时,必须考虑这样的事实。
图 1 中显示的数据是在 XNUMX 月和 XNUMX 月发布的,并未显示四位可能候选人随时间的偏好趋势。[3] 如果选举在此期间举行,并且这些候选人都被纳入投票,那么结果将表明卢拉获得 39% 至 42% 的选票,另一名候选人获得 26% 至 29% 的选票。 至于有效选票,卢拉将获得 45% 至 49% 的选票。
有必要指出,数据未表明所考虑的两个月内有任何显着变化的证据这一事实并不能证明没有变化:没有影响的证据并不意味着它不存在。
除了抽样过程中典型的随机变化和不同投票公司因不同的方法和关于选民概况的假设而获得的结果之间的差异之外,结果之间还存在可能导致错误结论的相关效应。
要理解这一点,请假设只有两个候选人的情况。 有一千人接受采访,例如,600 人说他们更喜欢 A,400 人更喜欢 B:分别为 60% 和 40%。 几天后,在同一条街上,又采访了 1000 人(由同一家公司,使用相同的方法和假设等)。 即使选民的偏好没有差异,说他们更喜欢 A 的人数也可能比 600 多一点或少一点只是偶然。 假设它是 630 (63%)。 因此,表示更喜欢候选人B的人数必然会更少,只有370人(37%)。 这可能给人一种选民偏好发生变化的印象:对其中一个候选人的偏好增加,“确认选民立场的这种变化”,对另一个候选人的偏好降低; 它们之间的差异增加了 6%,远远超出了典型的误差范围。
但数据并不支持这个结论,上面引号里的话是错误的。 B 下降的事实,而不是“确认趋势”,只是反映了两个候选人的百分比偏好之和是固定的,100%:如果一个增长,另一个必然下降。
当有两个以上的候选人时,这种效果就不那么明显了; 但是,当其中两个在总票数中所占比例较大时,如图1所示的数据,则效果显着。 这种效应意味着,虽然两位主要候选人的偏好在 12% 到 13% 的范围内变化,但在同一时期,两者的偏好之间的差异是 22%。
所描述的所有影响的组合必须在所考虑的时期的研究中发生。 例如,在图 2 左侧突出显示的区域中,卢拉的候选资格似乎已经下降,而且下降了很多,整个 XNUMX 月上半月的位置几乎发生了逆转。
然而,这一事实可能只是所考虑影响的组合。 首先,候选人明显偏好的 3% 数量级的变化并不显着。 其次,由于上面讨论的影响,这两个得票最多的候选人之一的得分的增加(仅通过随机波动)很可能意味着另一个的减少,这导致双重数量级差异的变化. 该值的 6% 可能没有统计意义。 第三个影响是,在图 2 突出显示的时间段末,包括了电话调查; 在所分析的时期内,电话调查平均显示给卢拉的票数较少,而给博尔索纳罗的票数较多。
因此,数据不允许我们得出结论,认为该时期存在系统性变化。
图2 – 与图 1 相同,但仅适用于偏好最高的两名候选人。 突出显示的区域可能会错误地暗示一种趋势:对一个候选人的偏好下降而对另一个候选人的偏好增加。
结论
我们可以通过仅查看一家公司随时间推移呈现的结果来分析选举民意调查的结果,这可以防止观察到的变化受到关于投票人口的社会经济概况和所采用的方法(电话和面对面)的不同假设的影响。例如面对面)。例如)。 但是,这样做会限制我们可以分析的信息量。
考虑来自不同研究机构的数据具有增加信息量的优势,但由于采用的假设和方法不同,会增加波动性。
无论分析选项是什么,都必须避免仓促下结论。 同样重要的是要记住,选举偏好会随着时间的推移而缓慢变化,除非出现非常引人注目的事实或消息,无论是真是假。
*奥塔维亚诺海伦 是 USP 物理研究所的高级教授。
笔记
[1] 由以下机构进行的调查:Quaest、Ipespe、Datafolha、Paraná Pesquisas、MDA、Ideia、Futura、PoderData、Gerp。
[2] 日期对应于进行调查的日期,而不是结果公布的日期。
[3] 这并不意味着选民的偏好没有变化; 只是没有证据。