使用SMOKE.RAW中的数据。
(i)变量cigs是平均每天抽烟的数量。样本中有多少人根本就不抽烟?有多大比例的人声称每天抽20支?你为什么认为抽20支香烟的人会有所堆积?
(ii)给定你对第(i)部分的回答,cigs看起来具有条件泊松分布吗?
(iii)用log(cigpric)、log(income)、white、educ、age和age2作为解释变量,估计cigs的一个泊松回归模型。估计的价格和收入弹性是多少?
(iv)利用极大似然标准误,价格和收入变量在5%的水平上统计显著吗?
(v)求方程(17.35)后面介绍的σ2估计值。σ是多少?你应该如何调整第(iv)部分中的标准误?
(vi)利用第(v)部分中调整后的标准误,价格和收入弹性现在统计显著异于零吗?请解释。
(vii)利用更稳健的标准误,教育和年龄变量显著吗?你如何解释educ的系数?
(viii)求泊松回归模型的拟合值yi。找出最大值和最小值,并讨论指数模型对瘾君子的预测表现。
(ix)利用第(viii)部分的拟合值,求yi和yi之相关系数的平方。
(x)使用第(iii)部分中的解释变量(及相同的函数形式),用OLS估计cigs的一个线性模型。线性模型和指数模型哪个拟合得更好?两者的R都很大吗?