计量经济学论文和R语言同时学好吗

3377人阅读
CRAN任务视图:计量经济学
线形回归模型(Linear regression models)
?&&&线形模型可用stats包中lm()函数通过OLS来拟合,该包中也有各种检验方法用来比较模型,如:summary()&和anova()。
?&&&lmtest包里的coeftest()和waldtest()函数是也支持渐近检验(如:z检验而不是检验,卡方检验而不是F检验)的类似函数。
?&&&car包里的linear.hypothesis()可检验更一般的线形假设。
?&&&HC和HAC协方差矩阵的这些功能可在sandwich包里实现。
?&&&car和lmtest包还提供了大量回归诊断和诊断检验的方法。
?&&&工具变量回归(两阶段最小二乘)由AER包中的ivreg()提供,其另外一个实现sem包中的tsls()。
微观计量经济学(Microeconometrics)
?&&&许多微观计量经济学模型属于广义线形模型,可由stats包的glm()函数拟合。包括用于选择类数据(choice data)的Logit和probit模型,用于计数类数据(count data)的poisson模型。这些模型回归元的值可用effects获得并可视化。
?&&&负二项广义线形模型可由MASS包的glm.nb()实现。aod包提供了负二项模型的另一个实现,并包含过度分散数据的其它模型。
?&&&边缘(zero-inflated)和hurdle计数模型可由pscl包提供。
?&&&多项响应(Multinomial response):特定个体协变量(individual-specific covariates)多项模型只能由nnet包中multinom()函数提供。mlogit包实现包括特定个体和特定选择(choice-specific)变量。多项响应的广义可加模型可由VGAM包拟合。针对多项probit模型的贝叶斯方法由MNP包提供,各种贝叶斯多项模型(包括logit和probit)在bayesm包中可得。
?&&&顺序响应(Ordered response):顺序响应的比例优势回归由MASS包中polr()函数实现。包ordinal为顺序数据(ordered data)提供包括比例优势模型(propotional odds models)以及更一般规范的累积链接模型(cumulative link models)。贝叶斯顺序probit模型由包bayesm提供。
?&&&删失响应(Censored response):基本删失回归模型(比如,tobit模型)可以由survival包中的suevreg()函数拟合,一个便利的接口tobit()在AER包中。更深入的删失回归模型,包括面板数据的模型,由censReg包提供,样本选择的模型在sampleSelection包中可得。
?&&&杂项:有关微观计量经济学得进一步精细工具由micEcon族包提供:Cobb-Douglas分析、translog、二次函数在micEcon里;规模弹性不变(Constant Elasticity of Scale,CES)函数在micEconCES里;对称归一二次利润(Symmetric Normalized Quadratic Profit,SNQP)函数在micEconSNQP里;几乎理想的需求函数模型系统(Almost
Ideal Demand System&,AIDS)函数在micEconAids包里;随机前沿分析(Stochastic Frontier Analysis)在frontier包中;bayesm包执行微观计量济学和营销学(marketing)中的贝叶斯方法;相对分布推断在包reldist里。
其它的回归模型(Further regression models)
?&&&非线性最小二乘回归建模可用stats包里的nls()实现。
?&&&分位数回归(Quantile Regression):quantreg(包括线性、非线性、删失、局部多项和可加分位数回归)。
?&&&面板数据的线性模型:plm。一个空间面板模型的包(splm)正在R-Forge开发。
?&&&广义动量方法(Generalized method of moments,GMM)和广义实证似然(generalized empirical likelihood,GEL):gmm。
?&&&线性结构方程模型:sem,包括两阶段最小二乘。
?&&&联立方程估计:systemfit。
?&&&非参核方法:np。
?&&&Beta回归:betareg和gamlss
?&&&截位(高斯)回归:truncreg。
?&&&非线性混合效应模型:nlme和lme4。
?&&&广义可加模型:mgcv、gam、gamlss和VGAM。
?&&&杂项:包VGAM、Design和Hmisc包提供了若干(广义)线性模型处理的扩展工具,Zelig是一个针对很多种回归模型的易于使用的统一接口。
基本的时间序列架构(Basic time series infrastructure)
?&&&stats包的“ts”&类是R的规则间隔时间序列的标准类(尤其是年度、季度和月度数据)。
?&&&“ts”格式的时间序列可以与zoo包中的“zooreg”&强制互换,而不丢失信息。zoo包规则和不规则间隔时间序列的架构(后者通过类“zoo”),其中时间信息可以是任意类。这包括日间序列(典型地,以“Date”时间索引)或日内序列(例如,以“POSIXct”时间索引)。
?&&&建立在“POSIXt”时间-日期类上的its、tseries和timeSeries(前fSeries)包也提供不规则间隔时间序列的架构,特别用于金融分析。
时间序列建模(Time series modelling)
?&&&stats包里有经典的时间序列建模工具,arima()函数做ARIMA建模和Box-Jenkins-type分析。
?&&&stats包还提供StructTS()函数拟合结构时间序列。
?&&&可以用nlme包中的gls()函数经由OLS拟合含AR误差项的线性回归模型。
?&&&时间序列的滤波和分解可以用stats&包的decompose()&和HoltWinters()&函数。
?&&&这些方法的扩展,尤其是预测和模型选择,在forecast&包里。
?&&&mFilter&里有各种各样的时序滤波方法。
?&&&估计向量自回归(VAR)模型,有若干方法可用:简单模型可用stats&包里ar()拟合,vars&包提供更精巧的模型,dse&中的estVARXls()和贝叶斯方法在MSBVAR&中。dynlm包有一个经由OLS拟合动态回归模型的方便接口,dyn实现了一个用于其它回归函数的不同方法。
?&&&可以用dse拟合更高级的动态方程组。
?&&&tsDyn&提供各种非线性自回归时序模型。
?&&&高斯线性状态空间模型可用dlm&拟合(通过最大似然、卡尔曼滤波/平滑和贝叶斯方法)。
?&&&包urca、tseries和CADFtest提供了单位根和协整技术。
?&&&时间序列因子分析在tsfa&包里。
?&&&包sde提供随机微分方程的模拟和推断。
?&&&非对称价格传导建模在apt包中。
?&&&矩阵操作(Matrix manipulations)。作为一个向量和矩阵语言,R有许多基本函数处理矩阵,与Matrix和SparseM包互补。
?&&&放回再抽样(Bootstrap)。除了推荐的boot包,bootstrap或simpleboot包里有一些其它的常规bootstrapping技术;还有些函数专门为时间序列数据而设计,如:meboot包里的最大熵bootstrap,tseries包里的tsbootstrap()函数。
?&&&不平等(Inequality)。为了测量不平等(inequality),集中(concentration)和贫穷(poverty),ineq包提供了一些基本的工具,如:劳伦茨曲线(Lorenz curves),Pen's parade,基尼系数(Gini coefficient)。
?&&&结构变化(Structural change)。R有很强的处理参数模型的结构变化和变化点的能力,可参考strucchange和segmented包。
数据集(Data sets)
?&&&Packages AER和Ecdat包含许多来自计量经济学教科书和杂志(应用计量经济学,商业/经济统计)的数据集。
?&&&AER另外提供大量例子再现来自教材和文献的分析,演示各种计量经济学方法。
?&&&FinTS&是Tsay的《Analysis of Financial Time Series》(2nd ed., 2005, Wiley)一书的R参考,包含运行其中一些例子所需的数据集、函数和脚本。
?&&&DNmoney包提供加拿大货币流通额。
?&&&pwt包提供佩恩世界表(Penn World Table)。
?&&&包expsmooth、fma和Mcomp分别是《Forecasting with Exponential Smoothing: The State Space Approach》(Hyndman, Koehler, Ord, Snyder, 2008, Springer)、《Forecasting: Methods and Applications》(Makridakis, Wheelwright,
Hyndman, 3rd ed., 1998, Wiley)和《the M-competitions》的时间序列数据包
?&&&包erer包含《Empirical Research in Economics: Growing up with R》(Sun, forthcoming)一书中的函数和数据集。
出处:/blog/4482985
参考知识库
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
访问:180656次
积分:2115
积分:2115
排名:第13941名
原创:15篇
转载:79篇
评论:17条
(2)(5)(2)(3)(2)(4)(1)(1)(2)(1)(2)(7)(5)(3)(8)(5)(2)(7)(1)(13)(6)(6)(6)苹果/安卓/wp
积分 43132, 距离下一级还需 12763 积分
权限: 自定义头衔, 签名中使用图片, 设置帖子权限, 隐身, 设置回复可见, 签名中使用代码
道具: 彩虹炫, 涂鸦板, 雷达卡, 热点灯, 金钱卡, 显身卡, 匿名卡, 抢沙发, 提升卡, 沉默卡, 千斤顶, 变色卡, 置顶卡
购买后可立即获得
权限: 隐身
道具: 金钱卡, 彩虹炫, 雷达卡, 热点灯, 涂鸦板
开心签到天数: 8 天连续签到: 1 天[LV.3]偶尔看看II
以下5种语言 NODE、LUA、Python、Ruby、R ,哪个在2014年的应用前景会更好?我毫不犹豫的选择R。R不仅是2014年,也是以后更长一段时间的主角。为什么我会选择R?我会从下面的几个方面,来说明我选择R的原因。R的基因
R的社区和资源
R的思维模式
R解决的问题
R的不足1). R的基因R是统计学家发明的语言,天生具有统计的基因。从我开始学习R语言,我就开始了知识的跨界思考。统计基于概率论,概率论又基于数学,用计算机的方式编程,解决某个领域的实际问题。简单一算,4个学科知识的交集,决定着我们解决问题的能力。统计的基因,让R语言与众不同!2). R的发展R一直在小众领域成长着,最早也只有统计学家在用,主要用R来代替SAS做统计计算。时代在进步,随着大数据的爆发,R终于在这一波浪潮中,被工业界所发现。然后,有越来越多的工程背景的人加入到这个圈子,对R计算引擎,R的性能,R的各种程序包进行改进和升级,让R获得了新生。我们现在用到的R语言软件,已经越来越接近工业软件的标准了。由工程师推动的R的发展速度,远远地超过了由统计学家推动的步伐。随着人们对数据分析要求的进一步增加,R会以更快的脚步继续发展,将成为免费的、开源的、数据分析软件的代名词。3). R的社区和资源R的发展,离不开R的社区支持。在R的社区中,我们可以下载到R语言软件,R的第三方软件包,和R的其他支持软件。可以找到开发者论坛,R-Journal列表,软件包列表,R语言图书列表,R用户组等的信息,同其他语言的社区资源一样丰富。R是自由软件,开发者可以开发自己的软件包,封装自己的功能,然后在CRAN上面发布。截止到2014年2月,共有5236个R包在CRAN上面发布。可能很多人会说只有5236个包,数量太少了。这是因为CRAN是需要提交申请的,R语言小组审核,检查后再会发布的出来。而且审核非常严格的,高质量是发布一个新的R包基本要求。由于CRAN过于严格的审查,让很多的开发者选择在RForge上发布,还有些R包是基于Github发布的,我也在 github上面发布了自己的R包:4). R的哲学每种语言都有自己的设计理念和哲学,而我体会的R的哲学,就是“静下心做事情”。R不需要很长的代码,R也不需要设计模式。一个函数调用,传几个参数,就能实现一个复杂的统计模型。我们需要思考,用什么模型,传什么参数,而不是怎么进行程序设计。我们可能会用R实现 “从一个数学公式,变成一个统计模型” 的过程,我们也可能会考虑 “如何让一个分类器结果更准确”,但我们不会思考 “时间复杂度是多少,空间复杂度是多少”。R的哲学,可以让你把数学和统计学的知识,变成计算模型,这也是R的基因所决定的。5). R的使用者R语言早期主要是学术界统计学家在用,在各种不同的领域,包括统计分析,应用数学,计量经济,金融分析,财经分析,人文科学,数据挖掘,人工智能,生物信息学,生物制药,全球地理科学,数据可视化等等。近些年来,由互联网引发的大数据革命,才让工业界的人,开始认识R,加入R。当越来越多的有工程背景的人,加入到R语言使用者的队伍后,R才开始像着全领域发展,逐步实现工业化的要求。RevolutionAnalytics公司的RHadoop产品,让R可以直接调用Hadoop集群资源
RStudio公司的RStudio产品,给了我们对于编辑软件新的认识
RMySQL, ROracle, RJDBC 打通了R和数据库访问通道
rmongodb, rredis, RHive, rhbase, RCassandra 打通过R和NoSQL的访问通道
Rmpi, snow 打通了单机多核并行计算的通道
Rserve,rwebsocket 打通了R语言的跨平台通信的通道
R不仅是学术界的语言,更将成为工业界必备的语言。6). R的语法R是面向对象语言,语法如同Python。但R的语法很自由,很多函数的名字,看起来都是那么随意,这也是R的哲学的一部分吧!看到这样的赋值语法,有其他语言基础的程序员,肯定会崩溃的。& a&-c(1,2,3,4)-&b
[1] 1 2 3 4
[1] 1 2 3 4随机取正态分布N(0,1)的10个数,又是这么的简单。& rnorm(10)
[1] -0.&&1. -0.&&0.
[5]&&0.&&1.&&0.&&0.
[9]&&0. -0.用R画鸢尾花的数据集的散点图,非常好的可视化效果& data(iris) #加载数据集
& head(iris) #查看前6行数据集
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1& && && & 5.1& && && &3.5& && && & 1.4& && && &0.2&&setosa
2& && && & 4.9& && && &3.0& && && & 1.4& && && &0.2&&setosa
3& && && & 4.7& && && &3.2& && && & 1.3& && && &0.2&&setosa
4& && && & 4.6& && && &3.1& && && & 1.5& && && &0.2&&setosa
5& && && & 5.0& && && &3.6& && && & 1.4& && && &0.2&&setosa
6& && && & 5.4& && && &3.9& && && & 1.7& && && &0.4&&setosa& plot(iris) #画图正是因为R自由哲学,让R的语法独特而简洁,我已经喜欢上这种哲学了。7). R的思维模式R语言让我跳出了原有思维定式。使用R语言,我们应该从统计学的角度想问题,而不是计算机的思维模式。R语言是直接面向数据的语言。在我们的日常生活中,无论做什么事情都会产生数据,上网有浏览数据,买东西有消费数据,就算什么都不干,也会受大气PM2.5的影响。利用R语言,我可以直接分析这些数据。面向什么业务,就分析什么数据,不需要从产品经理向程序员的角色转换,不需要考虑有什么功能,更不需要考虑程序设计的事。跳出程序员的思维模式,你所能认知的东西会更多,找到更适合自己的定位。8). R解决的问题当数据成为生产资料的时候,R就是为人们能运用生产资料创造价值的生产工具,R语言主要解决的是数据的问题。在很长期的历史时期,人类产生的数据都没有自互联网诞生以来产生的数据多;当Hadoop帮助人们解决了大数据存储的问题后,如何发现数据的价值,成为当前最火的话题。R语言的统计分析能力,就是数据分析最好的工具。所以,R要解决的问题,就是大数据时代的问题,是时代赋予的任务。9). R的不足前面说了太多R的优点了,R也有很多不足之处。R语言是统计学家编写的软件,并不如软件工程师编写的软件那么健壮。
R语言软件的性能,存在一些问题。
R语言很自由,语法命名不太规范,需要花时间熟悉。
R语言结合了很多数学、概率、统计的基础知识,学起来有一定门槛。R的这些不足,都是可以克服的。当有更多的工程背景的人加入的时候,R语言会比现在更强大,帮助使用者创造更多的价值。
R的应用前景R可以做所有SAS做的事情。R应用最热门的领域:统计分析:包括统计分布,假设检验,统计建模
金融分析:量化策略,投资组合,风险控制,时间序列,波动率
数据挖掘:数据挖掘算法,数据建模,机器学习
互联网:推荐系统,消费预测,社交网络
生物信息学:DNA分析,物种分析
生物制药:生存分析,制药过程管理
全球地理科学:天气,气候,遥感数据
数据可视化:静态图,可交互的动态图,社交图,地图,热图,与各种Javascript库的集成R有着非常广阔的应用前景,而且R也将成为新一代的最有能力创造价值的工具。
时代赋予R的任务R语言是在大数据时代被工业界了解和认识的语言,R语言被时代赋予了,挖掘数据价值,发现数据规律,创造数据财富的任务。R语言也是帮助人们发挥智慧和创造力的最好的生产工具,我们不仅要学好R语言,还要用好R语言,为社会注入更多的创新的生产力。所以,通过上面的几节内容所有的文字描述,我认为“R是最值得学习的编程语言”。不论你还在读书,还是已经工作,掌握R语言这个工具,找最适合自己的位置,前途将无限量。最后总结:在这5种语言中,R是最特殊的,R被赋予了与其他语言不同的使命。R的基因决定了,R将成为2014年,也可能是以后更长一段时间的主角。& && && && && && && && && && && && && && && && && && && && && && && && && && && && && && && && && && && && && & (资料来源于网络)
LZ本身也被这个强大潮流又完全免费的软件所吸引,深感R语言的魅力....
支持楼主:、
购买后,论坛将把您花费的资金全部奖励给楼主,以表示您对TA发好贴的支持
载入中......
发表于123楼
R 是好用啊,我看我们学校N 多老师都想学R ,有一个大牛经常就去搞搞讲座什么的,就是用的R ,做论文什么的也是R ,看上去就高大上了,比stata ,sas,spss 从外观上就拔高了一个层次~~~~
就说学好R,就可以去我们总部Labs工作了,我真想学好它
热心帮助其他会员
对论坛有贡献
总评分:&经验 + 10&
学术水平 + 3&
热心指数 + 3&
本帖被以下文库推荐
& |主题: 78, 订阅: 32
回帖奖励 +2
回帖奖励 +2
毫不犹豫的选择R
回帖奖励 +2
顶起来。。。。
威廉姆,要向世界展示實用主義,進攻性及冷靜的計算相結合的無堅不摧的力量。
回帖奖励 +2
谢谢楼主分享,支持一下
回帖奖励 +2
就说学好R,就可以去我们总部Labs工作了,我真想学好它
回帖奖励 +2
回帖奖励 +2
谢谢楼主分享~~
回帖奖励 +2
回帖奖励 +2
初级热心勋章
初级热心勋章
初级学术勋章
初级学术勋章
中级学术勋章
中级学术勋章
中级热心勋章
中级热心勋章
初级信用勋章
初级信用勋章
中级信用勋章
中级信用勋章
高级学术勋章
高级学术勋章
高级热心勋章
高级热心勋章
高级信用勋章
高级信用勋章
特级信用勋章
高级信用勋章
特级学术勋章
特级学术勋章
无限扩大经管职场人脉圈!每天抽选10位免费名额,现在就扫& 论坛VIP& 贵宾会员& 可免费加入
加入我们,立即就学扫码下载「就学」app& Join us!& JoinLearn&
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
如有投资本站或合作意向,请联系(010-);
邮箱:service@pinggu.org
投诉或不良信息处理:(010-)
京ICP证090565号
京公网安备号
论坛法律顾问:王进律师苹果/安卓/wp
积分 199, 距离下一级还需 61 积分
权限: 自定义头衔
道具: 彩虹炫, 涂鸦板, 雷达卡, 热点灯, 金钱卡, 显身卡, 匿名卡下一级可获得
权限: 签名中使用图片
购买后可立即获得
权限: 隐身
道具: 金钱卡, 彩虹炫, 雷达卡, 热点灯, 涂鸦板
开心签到天数: 96 天连续签到: 1 天[LV.6]常住居民II
最近经常看到R语言,好郁闷。他比sas做统计分析还要专业吗?
支持楼主:、
购买后,论坛将把您花费的资金全部奖励给楼主,以表示您对TA发好贴的支持
载入中......
新生之力 发表于
最近经常看到R语言,好郁闷。他比sas做统计分析还要专业吗?就是一种编程语言,像matlab, c++一样
是一种统计软件的语言
无限扩大经管职场人脉圈!每天抽选10位免费名额,现在就扫& 论坛VIP& 贵宾会员& 可免费加入
加入我们,立即就学扫码下载「就学」app& Join us!& JoinLearn&
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
如有投资本站或合作意向,请联系(010-);
邮箱:service@pinggu.org
投诉或不良信息处理:(010-)
京ICP证090565号
京公网安备号
论坛法律顾问:王进律师计量经济学好难,求大神教怎么学_江苏师范大学吧_百度贴吧
&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&签到排名:今日本吧第个签到,本吧因你更精彩,明天继续来努力!
本吧签到人数:0成为超级会员,使用一键签到本月漏签0次!成为超级会员,赠送8张补签卡连续签到:天&&累计签到:天超级会员单次开通12个月以上,赠送连续签到卡3张
计量经济学好难,求大神教怎么学收藏
计量经济学好难,求大神教怎么学啊?
登录百度帐号推荐应用
为兴趣而生,贴吧更懂你。或R语言学习与应用(15)
计量经济学(3)
不知不觉,研一生活已经过去一半了,看自己现在的状态,不由得惭愧,时间管理不够好,学习没有跟上。尽量争取多写点博客,算做对自己的安慰。
本博文代码和rmd文档见
#B2的符号最有可能为正,更高的家庭收入意味着母亲孕育更好的营养以及孕期呵护。
#一方面,家庭收入的增加会增加对食物的购买,包括香烟的支出;但另一方面,高收入通常意味着有良好的教育,受教育多者吸烟数量较少,两者存在负相关。
data_bwght&-read.csv('/home/wangjianlong/files/R/blog/economitrical/ch_3/bwght.csv')
lm_bw&-lm(bwght~cigs+faminc,data=data_bwght)#包括faminc
lm_bw_0&-lm(bwght~cigs,data=data_bwght)#不包括faminc
summary(lm_bw)#r squared 0.0284 n=1388
#bwght=116.97-0.46341cigs+0.09276faminc
summary(lm_bw_0)#r squared
0.02202 n=1388
#bwght=119.772-0.51377 cigs
#从大小来看并没有显著改变cigs对bwght的估计,因为cigs与faminc存在较小的相关性,faminc前较小的系数也可以看出来。
data_hprice&-read.csv('/home/wangjianlong/files/R/blog/economitrical/ch_3/hprice1.csv')
lm_hprice&-lm(price~sqrft+bdrms,data=data_hprice)
summary(lm_hprice)
0.12844*140+1*15.19819
0.12844*2438+4*15.19819-19.325
data_ceosal2&-read.csv('/home/wangjianlong/files/R/blog/economitrical/ch_3/ceosal2.csv')
lm_ceosal2&-lm(log(salary)~log(sales)+log(mktval),data=data_ceosal2)
summary(lm_ceosal2)
lm_ceosal2_1&-lm(log(salary)~log(sales)+log(mktval)+Profits,data=data_ceosal2)
summary(lm_ceosal2_1)
lm_ceosal2_2&-lm(log(salary)~log(sales)+log(mktval)+Profits+ceoten,data=data_ceosal2)
summary(lm_ceosal2_2)
cor.test(log(data_ceosal2$mktval),data_ceosal2$Profits)
data_attend&-read.csv('/home/wangjianlong/files/R/blog/economitrical/ch_3/attend.csv')
new_data&-data_attend[,c(3,4,6)]
summary(new_data)
lm_attend&-lm(atndrte~priGPA+ACT,data=data_attend)
summary(lm_attend)
#atndrte=75.7+17.26priGPA-1.717ACT
#当priGPA与ACT都为0时,上课参与率为75.7% 很明显与实际意义不符
#当ACT保持不变的时候,priGPA每增加一个单位,学生参与率平均增加了17.26个百分点.
#当priGPA保持不变时,而ACT分数每增加一分,学生参与率平均减少1.717个百分点 ,这个系数的结果令人吃惊,意味着5分ACT的课堂参与率会减少8.5.。由于ACT测量学生的潜力,ACT越高的人通常有更高的学习能力,能够在课余时间将缺失的课给学回来。
75.7+17.26*3.65-20*1.717#104.359 样本中最大为100 没有这样的值。在实际中这个结果也是不可能的,这需要我们在实际的回归对因变量设定一定的上界和下界,这里需要设定100的上界。
17.26*(3.1-2.1)-1.717*(21-26) #出勤率相差25.845%
data_wage1&-read.csv('/home/wangjianlong/files/R/blog/economitrical/ch_3/wage1.csv')
lm_wage1&-lm(educ~exper+tenure,data=data_wage1)
r1&-residuals(lm_wage1)
lm_wage2&-lm(log(wage)~r1,data=data_wage1)
lm_wage3&-lm(log(wage)~educ+exper+tenure,data=data_wage1)
summary(lm_wage3)#0.092029
summary(lm_wage2)#0.09203
#两者系数相等。因为在lm_wage2回归中,log(wage)对r1的回归只解释了edu对log(wage)的影响,此时edu与exper tenure不相关。这与log(wage)对educ、exper、tenure回归中解释变量相同,说明两者都可以解释为在其他变量不变的情况。
data_wage2&-read.csv('/home/wangjianlong/files/R/blog/economitrical/ch_3/wage2.csv')
lm_wage2_1&-lm(IQ~educ,data=data_wage2)
coefficients(lm_wage2_1)#斜率为3.533829
lm_wage2_2&-lm(log(wage)~educ,data=data_wage2)
coefficients(lm_wage2_2)#斜率为0.
lm_wage2_3&-lm(log(wage)~educ+IQ,data=data_wage2)
coefficients(lm_wage2_3)#斜率分别为0. 0.
0.+0.*3.533829#等于0.
data_meap93&-read.csv('/home/wangjianlong/files/R/blog/economitrical/ch_3/meap93.csv')
lm_meap93&-lm(math10~log(expend)+lnchprg,data=data_meap93)
summary(lm_meap93)
#math10=-20.70log(expend)-0.30459lnchprg
#Adjusted R-squared:
#预期相一致 。花费较多的学生家庭生活水平较高,通常在教育支出方面较多,从而数学通过率较高。而参加午餐计划的比例越高,说明贫困孩子比例高,通过数学的比例下降。
#截距为所有变量为0时因变量的预测值,此回归方程中截距为负数,没有实际意义。
#lnchprg为0,有实际意义,说明该学校贫困孩子为0
#log(expend)为0,意味着expend为1,这不合常理
lm_meap93_1&-lm(math10~log(expend),data=data_meap93)
coefficients(lm_meap93_1)#11.16440
#这个斜率支出效应更大
cor(data_meap93$lexpend,data_meap93$lnchprg)#-0.1927041
#符号为负,与预期相同
#利用题C3.6(4)的等式就可以解释
data_discrim&-read.csv('/home/wangjianlong/files/R/blog/economitrical/ch_3/discrim.csv')
mean(data_discrim$prpblck)
sd(data_discrim$prpblck)
mean(data_discrim$income)
sd(data_discrim$income)
lm_discrim&-lm(psoda~prpblck+income,data=data_discrim)
summary(lm_discrim)
lm_discrim_1&-lm(psoda~prpblck,data=data_discrim)
summary(lm_discrim_1)
lm_discrim_2&-lm(log(psoda)~prpblck+log(income),data=data_discrim)
summary(lm_discrim_2)
lm_discrim_3&-lm(log(psoda)~prpblck+log(income)+prppov,data=data_discrim)
summary(lm_discrim_3)
cor(data_discrim$income,data_discrim$prppov)
data_charity&-read.csv('/home/wangjianlong/files/R/blog/economitrical/ch_3/charity.csv')
lm_charity&-lm(gift~mailsyear+giftlast+propresp,data=data_charity)
summary(lm_charity)
#gift=-4..166259 mailsyear+ 0.005927giftlast+ 15.358605 propresp
#Adjusted R-squared:
lm_charity_1&-lm(gift~mailsyear,data=data_charity)
#gift=2.5 mailsyear
summary(lm_charity_1)#Adjusted R-squared:
#多元回归模型增加的变量增强了解释能力
#当其他变量不变时,mial每增加一封,gift一年平均增加 2.166259个单位
#它比简单回归系数小
#当mail数量不变时,回复率每增加一个百分点,gift平均一年增加0.005927个单位
lm_charity_2&-lm(gift~mailsyear+giftlast+propresp+avggift,data=data_charity)
summary(lm_charity_2)#mailsyear 减少到1.20117
cor(data_charity$mailsyear,data_charity$avggift)#由于mailsyear与avggift之间是正相关,且gift对avggift回归的系数为正,所以mailsyear的估计效应与不包含avggift的回归模型相比较小。
#由0.005927一个正的系数改变为负的-0.26086,系数符号变化 可能变量之间存在多重共线性。
参考知识库
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
访问:28996次
排名:千里之外
原创:27篇
(4)(1)(6)(2)(2)(5)(7)

我要回帖

更多关于 高级计量经济学 的文章

 

随机推荐