本科生应该 “有能力” 对理论 进行验证 —— 多元回归分析 ... ... ...
已有 169 次阅读2017-4-26 17:48
|
回归分析, 本科生, 能力
本科生不是知识的创造者,它是一个知识的使用者。
但对于使用者来说,你首先要学会对学到的知识进行验证。
**************************************************************************
假如政府雇佣了你,让你对公共机构的工作培训项目进行效果评价。
假设这个项目是培训工人在生产过程中是用计算机的各种方法。(就是电算化啊、等级证 这种烂证的培训)
为期20周的培训都是在工人的非工作时间进行的。任何一个按小时计酬的生产工人都可以自愿参加全部或部分培训。
你要决定培训项目对每个工人以后的小时工资有何影响。
假定你为一家投资公司工作,并研究对国债的各种不同投资战略的回报,看看它们是否与经济理论的含义相一致。
你知道国外的理论不一定能照搬到中国来。
**************************************************************************
《奥迪斯·邓肯的学术成就:社会科学中用于定量推理的人口学方法》
我以前讲过 “穆勒五法”
**************************************************************************
数据集的数据结构
1、横截面数据
横截面数据的一个重要特征是,我们通常可以假定,它们是从样本背后的总体中通过随机抽样得到的。
2、时间序列数据
这没什么好说的,有些数据就是带时间特征。流水账
3、混合数据和 面板数据
为什么要用混合数据啊?因为 面板数据不容易得到。因为你是在外部。
当然你要是在内部,可以用面板数据。 对同一单位进行多次观测,长时间的观测
面板数据的第二个优点,能观测到时间的滞后效应。
**************************************************************************
跨境杀:越级挑战
本科生不是产生知识,而是验证知识。
可以让他们先说,然后验证一下他们说的对不对。
照妖镜,你得知道他们说的对不对。
我知道你也不是博士,“不是让你去挑战博士的”,博士里面也有很多坏人。
还要专家教授,我最讨厌这种人了。
咱们这个门派,唯象,不找原因,就是“人家咋着,咱咋着”
人家这么弄,能发财,咱这么弄,也能发财。
就这么简单的一个道理。
找原因这种事情,让博士去干吧。
专家呕吐,博士流泪。
**************************************************************************
经济学家的目标就是要推定一个变量(比如受教育程度)对另一个变量(如犯罪率或工人的生产力)具有因果效应(causal effect)。
虽然简单地发现两个或多个变量之间有某种联系很诱人,但除非能得到某种因果关系,否则这种联系很难令人信服。
其他条件不变,意味着“其他(相关)因素保持不变”的概念,在因果分析中有重要作用。
在初级经济学教程中,很多经济学问题都有其他条件不变的特征。
*************************************************************
你知道我们学的都是初级教程,有没有一个办法,可以越级挑战,这是本文的重点。
*************************************************************
时间停止运行,跟电影一样,你喊 卡,它就停了。
还原法,你也知道,不一定对。
综合起来,不一定。
但是这已经是一个很好的工具了。
还原法+ 直觉= 跟解放军一样,简单工具+劳动,搞一些大事情
本科你还想干什么,你就是一个本科。
*************************************************************
社会科学所搜集到的数据多数具有非实验特征,所以发现其中的因果关系极具挑战性。
这在玄幻小说里,被称为“跨境杀”
就是你境界在人家之下,还要审它。
其实我们都想学这种,简单又强大刀法,“剑磨两边,刀磨一边就够了”
*************************************************************
简单回归模型可以用来研究两个变量之间的关系。
简单回归模型作为经验分析的一般工具还存在着局限性,不过有时把它作为一个经验工具还是很合适的。
比如说 y是大豆产出,x是施肥量;y是每小时工资,x 是受教育的年数,y是社区犯罪率,x是警察的数量。
在写出用x 解释y 的模型时,我们要面临三个问题。 (两变量模型就碰见问题了)
首先,既然两个变量之间没有一个确切的关系,那么我们应该如何考虑其他影响y 的因素呢?
第二,y 和x 的函数关系是怎样的呢?
第三,我们何以确定我们在其他条件不变的情况下刻画了y和x 之间的关系呢?(如果这是一个理想目标的话)
我们可以通过写出关于y 和x 的一个方程来消除这些疑惑。
一个简单的方程是:
y=b0+b1x + u
假定方程在我们所关注的总体中成立,它便定义了一个简单线性回归模型。
均值,其实就是最小二乘法。 取平均值的经验方法被最小二乘法的概念替代。(高斯和勒让德)
线性形式意味着:不管x 的初始值为多少,它的任何一单位变化对y的影响都是相同的。
这对许多经济应用来说是不现实的。
举例来说,在工资——教育的例子中,我们或许还要考虑到递增的回报,即,后一年的教育比前一年的教育对工资的影响更大。
************************************************************************
回归可能是直线,也可能是对数。(这都是对数据的拟合,想象中的一根线)
对数的特征是斜率不发生变化,而是形式近似于 比例变化。
扩展阅读:
统计学之美(二):多元回归分析
https://zhuanlan.zhihu.com/p/24263575
**********************************************************************
“越境杀,不越境杀” ;这个不重要
跟玩游戏一样,你先能自保再说
怕你连自保都不能,就被洗脑了