看這篇paper看的自閉了。作者用了太多操作了。。。
摘要:
作者的意思應該是要在一些無監督的語句中學會一些可解釋的離散的laent action,然後用這些laent action指導對話的生成。什麼叫可解釋呢,我覺得這篇論文的意思就是,這個latent(意圖,動作,相當于slot-value對)和這一句對話有直接的關系。然後作者就用了兩個新的模型,實際上就是魔改了VAE(看的我腦闊痛)分别是DI-VAE和DI-VST。
模型:
寫不動了,推薦幾篇寫的好的。
https://zhuanlan.zhihu.com/p/37630801 論文翻譯+大概了解
https://zhuanlan.zhihu.com/p/61899498 我認為了解的很深刻
一句話總結:
論文主要探索了一種無監督的學習方式,通過離散的latent action增強對話的生成以及增加生成的可解釋性,其主要創新點在于通過改變ELBO的loss函數解決了VAE的“posterior collapse ”問題。