前言
上一篇《最大似然估计(上)——离散选择模型之十二》中讲了最大似然估计(MLE)的基本思想,本文说一说如何利用最大似然估计来确定二项Logit模型的参数 。
在二项Logit模型中,决策主体 只有 、 两个方案可以选择。 选择方案 的概率可以表示为:
为方便理解,假设我们只观测到了2个样本:第一个决策者 (记为)选择了方案 ,第二个决策者 (记为)选择了方案 。
如果对应到日常生活中的场景,大家可以想象成“在某次顾客购买行为调查中,顾客1选择百事可乐、顾客2选择可口可乐”,或者“在某次居民出行行为调查中,乘客1选择打车、乘客2选择坐地铁”之类。
前文中已经说了:最大似然估计(MLE)的核心思想就是——对于随机变量 ,如果我们观测到事件 、 、…、 发生,那么 的概率分布就应该使得这些事件发生的概率最大。
上面的例子中,我们观测到了决策者 选择了方案 、 选择了方案 ;那么(1)式中的参数就应该使得 最大;即本例中的似然函数为:
在构建 Logit 模型的似然函数时,需要用一个小技巧对(2)式处理一下。我们引入哑变量 δ 和 δ —— 如果 选择 ,则 δ ,否则 δ ;类似地,如果 选择 ,则 δ ,否则 δ 。在二项Logit模型中, 不是选择 就是选择 ,所以 δδ 。利用哑变量 δ 和 δ,(2)式中的似然函数可以等价地表示成:
如果一共观测了 个样本,只需把(4)式中的 2 换成 即可。
对(4)式取对数、得到对数似然函数:
在(6)式中,当我们拿到样本数据以后, δ 、 δ 、 、 都是已知的;仅系数向量 未知。通过对 求偏导、令偏导数等于0,就可以得到一组关于 的方程组;求解方程组我们就可以得到参数 的值。
【END】
往期文章
- 最大似然估计(上)——离散选择模型之十二
- Odds 和 Odds Ratio 的区别——离散选择模型之十一
- 从Gumbel分布到Logistic分布——离散选择模型之十
- 效用最大化准则:离散选择模型的核心(二项Logit模型)——离散选择模型之九
- 效用最大化准则:离散选择模型的核心(Probit模型下篇)——离散选择模型之八
- 效用最大化准则:离散选择模型的核心(Probit模型上篇)——离散选择模型之七
- Logit模型拟合实战案例(Python)——离散选择模型之六
- Logit模型拟合实战案例(SAS)——离散选择模型之五
- 正确打开/解读Logit模型系数的方式——离散选择模型之四
- Logit究竟是个啥?——离散选择模型之三
- 线性模型 vs. Logistic模型——离散选择模型之二
- 离散选择模型(Discrete Choice Model)简介——离散选择模型之一
喜欢的朋友可以打赏、点赞、留言、关注,谢谢支持!