天天看点

最大似然估计_最大似然估计(下)——离散选择模型之十三

前言

上一篇《最大似然估计(上)——离散选择模型之十二》中讲了最大似然估计(MLE)的基本思想,本文说一说如何利用最大似然估计来确定二项Logit模型的参数 。

在二项Logit模型中,决策主体  只有  、  两个方案可以选择。 选择方案  的概率可以表示为:

为方便理解,假设我们只观测到了2个样本:第一个决策者 (记为)选择了方案  ,第二个决策者 (记为)选择了方案  。

如果对应到日常生活中的场景,大家可以想象成“在某次顾客购买行为调查中,顾客1选择百事可乐、顾客2选择可口可乐”,或者“在某次居民出行行为调查中,乘客1选择打车、乘客2选择坐地铁”之类。

前文中已经说了:最大似然估计(MLE)的核心思想就是——对于随机变量  ,如果我们观测到事件  、  、…、  发生,那么  的概率分布就应该使得这些事件发生的概率最大。

上面的例子中,我们观测到了决策者  选择了方案  、 选择了方案  ;那么(1)式中的参数就应该使得  最大;即本例中的似然函数为:

在构建 Logit 模型的似然函数时,需要用一个小技巧对(2)式处理一下。我们引入哑变量 δ  和 δ —— 如果  选择  ,则 δ ,否则 δ ;类似地,如果  选择  ,则 δ ,否则 δ 。在二项Logit模型中, 不是选择  就是选择  ,所以 δδ 。利用哑变量 δ 和 δ,(2)式中的似然函数可以等价地表示成:

如果一共观测了  个样本,只需把(4)式中的 2 换成  即可。

对(4)式取对数、得到对数似然函数:

在(6)式中,当我们拿到样本数据以后, δ 、 δ 、  、  都是已知的;仅系数向量   未知。通过对  求偏导、令偏导数等于0,就可以得到一组关于  的方程组;求解方程组我们就可以得到参数  的值。

【END】

往期文章

  • 最大似然估计(上)——离散选择模型之十二
  • Odds 和 Odds Ratio 的区别——离散选择模型之十一
  • 从Gumbel分布到Logistic分布——离散选择模型之十
  • 效用最大化准则:离散选择模型的核心(二项Logit模型)——离散选择模型之九
  • 效用最大化准则:离散选择模型的核心(Probit模型下篇)——离散选择模型之八
  • 效用最大化准则:离散选择模型的核心(Probit模型上篇)——离散选择模型之七
  • Logit模型拟合实战案例(Python)——离散选择模型之六
  • Logit模型拟合实战案例(SAS)——离散选择模型之五
  • 正确打开/解读Logit模型系数的方式——离散选择模型之四
  • Logit究竟是个啥?——离散选择模型之三
  • 线性模型 vs. Logistic模型——离散选择模型之二
  • 离散选择模型(Discrete Choice Model)简介——离散选择模型之一

喜欢的朋友可以打赏、点赞、留言、关注,谢谢支持!

最大似然估计_最大似然估计(下)——离散选择模型之十三

继续阅读