因果分析系列8----合适的控制变量
创始人
2025-05-29 03:47:11

因果分析系列8----合适的控制变量

  • 1.好的控制变量
  • 2.基本无害的控制
  • 3.坏的控制--选择性偏差

1.好的控制变量

因果系列6和因果系列7介绍了如何向回归模型中添加额外的控制变量以确定因果效应。如果控制变量是混杂变量,则必须将其添加到模型中。很多人看到这一点时,自然的反应是将TA能够测量的所有变量都放入模型中。在今天的大数据世界中,最终很可能超过1000个变量。事实证明,这完全没必要,而且很可能不利于因果识别。现在我们将把注意力转向不是混杂变量的控制变量。我们先看看怎样的是好的控制变量。然后,再深入探讨怎样的是坏的控制变量。

首先来看一个例子,假设你是一家金融科技公司催收团队中的数据科学家。你的任务是研究发送一封电子邮件要求逾期客户偿还债务对回收款金额的影响。因变量是逾期客户的付款金额。

为了回答这个问题,设计一个这样的实验:从逾期客户库中选择了5000个客户进行随机测试。对于每个客户,通过抛硬币,决定是否向客户发送电子邮件,如果硬币朝上,则向客户发送电子邮件,即该客户属于处理组;否则,客户将被作为控制组。通过这个测试,找出这封电子邮件能帮助收回多少违约的钱。

相关内容

热门资讯

苗族的传统节日 贵州苗族节日有... 【岜沙苗族芦笙节】岜沙,苗语叫“分送”,距从江县城7.5公里,是世界上最崇拜树木并以树为神的枪手部落...
北京的名胜古迹 北京最著名的景... 北京从元代开始,逐渐走上帝国首都的道路,先是成为大辽朝五大首都之一的南京城,随着金灭辽,金代从海陵王...
长白山自助游攻略 吉林长白山游... 昨天介绍了西坡的景点详细请看链接:一个人的旅行,据说能看到长白山天池全凭运气,您的运气如何?今日介绍...
世界上最漂亮的人 世界上最漂亮... 此前在某网上,选出了全球265万颜值姣好的女性。从这些数量庞大的女性群体中,人们投票选出了心目中最美...