机器学习与因果推断
Machine Learning and Causal Inference
从相关性到因果性
用数据回答“为什么”
课程信息
基本信息
- 课程名称: 机器学习与因果推断
- 授课对象: 高年级本科生
- 学分: 2学分
- 时间: 周一 16:00-17:30
- 地点: 明德商学楼0207
- 学期: 2025-2026学年春季学期
授课教师
陈志远 中国人民大学商学院 助理教授(贸易经济系)
- 📧 chenzhiyuan@rmbs.ruc.edu.cn
- 🏢 办公室: 919
- 🕒 Office Hours: 周四 14:00-15:00
📎 讲义
- 📋 课程大纲
- 📝 作业1:PSM-DID Monte Carlo
- 第一讲:课程导论 [课件] [详细讲义]
- 第二讲:概率与回归基础 [课件] [详细讲义]
- 第三讲:有向无环图 [课件] [详细讲义]
- 第四讲:匹配与分层 [课件] [详细讲义]
- 第五讲:工具变量法 [课件] [详细讲义]
- 第六讲:面板数据与双重差分法 [课件] [详细讲义]
- 第七讲:机器学习基础 I [课件] [详细讲义]
- 第八讲:机器学习基础 II [课件] [详细讲义]
- 第九讲:广义随机森林 [课件] [详细讲义]
- 第十讲:因果森林 [课件] [详细讲义]
- 第十一讲:双重机器学习 [课件] [详细讲义]
- 第十二讲:因果推断与 AI [课件] [详细讲义]
- 💻 课程代码仓库
📢 最新公告
2026-04-27 — 作业1已发布:用 Monte Carlo 模拟理解 PSM-DID。 📝 查看作业要求
2026-06-09 — 第十二讲课件和详细讲义已发布! 📊 课件:因果推断与 AI · 📖 详细讲义
2026-06-02 — 第十一讲课件和详细讲义已发布! 📊 课件:双重机器学习 · 📖 详细讲义
2026-05-26 — 第十讲课件和详细讲义已发布! 📊 课件:因果森林 · 📖 详细讲义
2026-04-28 — 第九讲课件和详细讲义已发布! 📊 课件:广义随机森林 · 📖 详细讲义
2026-04-26 — 第八讲课件和详细讲义已发布! 📊 课件:机器学习基础 II · 📖 详细讲义
2026-04-19 — 第七讲课件和详细讲义已发布! 📊 课件:机器学习基础 I · 📖 详细讲义
2026-04-12 — 第六讲课件和详细讲义已发布! 📊 课件:面板数据与双重差分法 · 📖 详细讲义
2026-04-07 — 第五讲课件和详细讲义已发布! 📊 课件:工具变量法 · 📖 详细讲义
课程描述
本课程系统介绍因果推断的理论基础与机器学习方法的结合,培养学生运用数据回答”为什么”的能力。课程分为两大模块:
模块一:经典因果推断方法(前8周)
| 周次 | 主题 | 核心内容 |
|---|---|---|
| 1 | 课程导论 | 相关vs因果,潜在结果框架入门 |
| 2-3 | 因果推断基础 | 潜在结果框架深入,混淆变量,识别策略 |
| 4 | 匹配法 | 倾向得分匹配,精确匹配,重叠条件 |
| 5-6 | 双重差分 | DID原理,平行趋势检验,动态效应 |
| 7 | 合成控制法 | 合成控制原理,安慰剂检验 |
| 8 | 工具变量法 | IV原理,2SLS,排他性约束 |
模块二:机器学习与因果推断(后6周)
| 周次 | 主题 | 核心内容 |
|---|---|---|
| 9-10 | ML基础 | 回归,决策树,随机森林,交叉验证 |
| 11-12 | 广义随机森林 | 异质性处理效应,置信区间 |
| 13 | 因果森林 | 异质性分析,Policy Learning |
| 14 | 双重机器学习 | Double ML,Neyman正交性 |
| 15-16 | 项目答辩 | 期末展示与点评 |
为什么要学习因果推断?
现实需求
- 营销投入真的带来销量增长了吗?
- 新产品上线真的提升了用户留存吗?
- 培训项目真的提高了员工绩效吗?
- 政策调整真的促进了经济发展吗?
技术趋势
- 🚀 AI时代的核心技能
- 📊 数据驱动决策的标配
- 🌍 学术界与业界的通用语言
- 💡 从“跑数据”到“洞察”的跃迁
课程特色
🤖 AI辅助编程
传统编程与Vibe Coding结合,提升学习效率
🐍 Python + R
双语言实践,覆盖主流数据科学生态
📚 理论与实践
经典方法与前沿ML方法并重,案例驱动
推荐教材
- Angrist & Pischke (2020). 《基本无害的计量经济学》
- Huntington-Klein (2022). The Effect: An Introduction to Research Design and Causality
- Chernozhukov et al. (2024). Applied Causal Inference Powered by ML and AI (在线阅读)
- Cunningham (2021). Causal Inference: The Mixtape (在线阅读)
- James, Witten, Hastie, Tibshirani, Taylor (2021). An Introduction to Statistical Learning: with Applications in Python (在线阅读)
- James, Witten, Hastie, Tibshirani (2021). An Introduction to Statistical Learning: with Applications in R (在线阅读)
在线资源
- Scikit-Learn文档(Python机器学习库)
- ISL-Python资源(《统计学习导论》Python库)
- ISL-R资源(《统计学习导论》R库)
- EconML文档(微软)
- DoubleML文档
- CausalML (Uber)
- 课程Gitee仓库