[NLG]Unsupervised Discrete Sentence Representation Learning for Interpretable Neural Dialog Generat

2023-06-19 05:47:59

看這篇paper看的自閉了。作者用了太多操作了。。。

摘要：

作者的意思應該是要在一些無監督的語句中學會一些可解釋的離散的laent action，然後用這些laent action指導對話的生成。什麼叫可解釋呢，我覺得這篇論文的意思就是，這個latent(意圖，動作，相當于slot-value對)和這一句對話有直接的關系。然後作者就用了兩個新的模型，實際上就是魔改了VAE（看的我腦闊痛）分别是DI-VAE和DI-VST。

模型：

寫不動了，推薦幾篇寫的好的。

https://zhuanlan.zhihu.com/p/37630801 論文翻譯+大概了解

https://zhuanlan.zhihu.com/p/61899498 我認為了解的很深刻

一句話總結：

論文主要探索了一種無監督的學習方式，通過離散的latent action增強對話的生成以及增加生成的可解釋性，其主要創新點在于通過改變ELBO的loss函數解決了VAE的“posterior collapse ”問題。

NLP 對話系統 dialogsystem 對話生成

上一篇: 論文閱讀之《Jointly Predicating Predicates and Argumentsin Neural Semantic Role Labeling》-ACL2018

下一篇: Chapter 14 Recurrent Neural NetworksChapter 14 Recurrent Neural NetworksOReilly. Hands-On Machine Learning with Scikit-Learn and TensorFlow讀書筆記

[NLG]Unsupervised Discrete Sentence Representation Learning for Interpretable Neural Dialog Generat

繼續閱讀

文本分類之 residual-connection+selfAttention的詞向量平均模型

新聞文本分類-06 基于Bert的文本分類

seq2seq模型 + Attention機制

elasticlunr.js 最新版本v0.6.7釋出啦應用示例為什麼你需要elasticlunr.js?

RNN/LSTM學習資料總結

使用中文維基百科進行GloVe實驗

從詞向量衡量标準到全局向量的詞嵌入模型GloVe再到一詞多義的解決方式衡量标準Evaluation引子全局向量的詞嵌入應用對一詞多義的思考Reference

NLP︱進階詞向量表達（一）——GloVe（理論、相關測評結果、R&python實作、相關應用）一、理論簡述二、測評三、Glove實作&R&python四、相關應用

GloVe與word2vec的差別，及GloVe的缺陷

更别緻的詞向量模型(一)：simpler glove

glove_python安裝（避免編譯錯誤）

python 分析qq聊天記錄

[一起學BERT]（一）：BERT模型的原理基礎Self-Attention機制理論Multi-head Self-Attention注意力機制位置編碼Transformer理論BERT理論

ELMO BERT GPT

BERT、Elmo、GPT一、發展曆史二、bert三、ERNIE四、GPT—transformer的decoder

人工智能如何有效地運用于自然語言處理