【論文解讀 KDD 2018 | HEER】Easing Embedding Learning by Comprehensive Transcription of HIN1 摘要2 介紹3 HEER4 總結參考文獻

論文連結：https://dl.acm.org/doi/10.1145/3219819.3220006

代碼連結：https://github.com/GentleZhu/HEER

會議：KDD 2018

1 摘要

HIN在引入豐富的資訊的同時，也引入了潛在的不相容性。為了保留網絡中豐富但潛在不相容的資訊，作者研究了對HIN的綜合轉錄問題。本文提出了HEER算法，通過結合邊的表示和恰當的異質度量，學習HIN的嵌入表示。（實驗任務是edge reconstruction task）

2 介紹

HIN不僅引入了豐富的語義資訊，還引入了潛在不相容的語義資訊，這為HIN的嵌入學習帶來了挑戰。例如下圖所示，Stan喜歡musical類型的電影，也喜歡Ang Lee導演的電影。但是Ang Lee沒有導演過musical類型的電影，是以若這些節點都被映射到同一個度量空間的話，Ang Lee和musical的距離會很遠，因為它們不相似。是以，在同一個度量空間中，Stan不可能同時和這兩個節點距離近。為了緩解這一問題，作者引入邊的表示并且針對不同類型的邊使用不同的度量空間。這樣Stan節點可以在兩個度量空間中分别于Ang Lee和musical距離近。

【論文解讀 KDD 2018 | HEER】Easing Embedding Learning by Comprehensive Transcription of HIN1 摘要2 介紹3 HEER4 總結參考文獻

2.1 動機

（1）研究HIN的綜合轉錄問題，目标是在嵌入表示中融入HIN中豐富且有着潛在不相容性的語義資訊，并且不涉及額外的專家知識、特征工程以及監督。

（2）提供易于使用的方法，充分發揮HIN中的資訊，以實作多種多樣的應用。

2.2 作者分析了現有的一些方法

（1）解決同質資訊網絡的方法通常是基于元路徑的，這不能解決HIN的綜合轉錄問題。因為元路徑的選擇很麻煩，而且選取出來的元路徑隻針對特定任務或者隻能反映出HIN的部分資訊。

（2）還有一些針對HIN的方法，隻對特定種類的HIN或添加了副資訊的HIN進行了表示學習。這些方法不能應用到一般的HIN。并且大多數針對HIN的嵌入表示方法隻為表示學習提供了一個度量空間，這可以處理HIN中部分可相容語義資訊，但是若對HIN整體記性綜合轉錄則會帶來資訊損失。

（3）最近的研究[1]提出了一個方法，通過在嵌入學習前将HIN分解成多個領域的，實作了在避免資訊損失的條件下（如：豐富的異質資訊、潛在沖突的語義資訊）獲得高品質的HIN表示。但是這種方法獨立地擷取到了不同領域的資訊，但是完全禁止了跨領域的聯合學習。本文提出的方法允許不同相容性的網絡元件，在聯合學習過程中進行不同程度的協作。

2.3 挑戰

（1）對複雜且不相容的異質資訊進行編碼；

（2）在無監督的情況下捕獲HIN的機構資訊，并且能辨識出潛在不相容的語義資訊。

作者提出HEER算法，在節點表示的基礎上建立邊的表示，并且為不同類型的邊采用不同的異構度量。同時，不同類型的邊上的資訊也被利用，反過來更新節點表示和邊表示。

2.4 貢獻

（1）研究了HIN嵌入學習中的綜合轉錄問題，保留了HIN豐富的語義資訊，并且易于在下遊任務中使用。

（2）提出現實世界中的HIN存在不可相容的語義資訊，這為HIN的綜合轉錄帶來了挑戰。

（3）提出算法HEER，利用邊的表示和異構度量，解決HIN的綜合轉錄問題。

（4）實驗證明了HEER的有效性。

3 HEER

3.1 一些定義

（1）異質資訊網絡

有向圖

【論文解讀 KDD 2018 | HEER】Easing Embedding Learning by Comprehensive Transcription of HIN1 摘要2 介紹3 HEER4 總結參考文獻
，節點類型映射

【論文解讀 KDD 2018 | HEER】Easing Embedding Learning by Comprehensive Transcription of HIN1 摘要2 介紹3 HEER4 總結參考文獻
，邊類型映射

【論文解讀 KDD 2018 | HEER】Easing Embedding Learning by Comprehensive Transcription of HIN1 摘要2 介紹3 HEER4 總結參考文獻
，

【論文解讀 KDD 2018 | HEER】Easing Embedding Learning by Comprehensive Transcription of HIN1 摘要2 介紹3 HEER4 總結參考文獻
或

【論文解讀 KDD 2018 | HEER】Easing Embedding Learning by Comprehensive Transcription of HIN1 摘要2 介紹3 HEER4 總結參考文獻
。
對于邊類型

【論文解讀 KDD 2018 | HEER】Easing Embedding Learning by Comprehensive Transcription of HIN1 摘要2 介紹3 HEER4 總結參考文獻
，定義

【論文解讀 KDD 2018 | HEER】Easing Embedding Learning by Comprehensive Transcription of HIN1 摘要2 介紹3 HEER4 總結參考文獻
，其中

【論文解讀 KDD 2018 | HEER】Easing Embedding Learning by Comprehensive Transcription of HIN1 摘要2 介紹3 HEER4 總結參考文獻
表示節點類型對

【論文解讀 KDD 2018 | HEER】Easing Embedding Learning by Comprehensive Transcription of HIN1 摘要2 介紹3 HEER4 總結參考文獻
由類型為r的邊連接配接。
【論文解讀 KDD 2018 | HEER】Easing Embedding Learning by Comprehensive Transcription of HIN1 摘要2 介紹3 HEER4 總結參考文獻
表示從節點u到節點v的類型為r的連邊e的權重。
【論文解讀 KDD 2018 | HEER】Easing Embedding Learning by Comprehensive Transcription of HIN1 摘要2 介紹3 HEER4 總結參考文獻
分别代表節點u的連邊類型為r的出度和入度。

（2）節點和邊的表示

節點嵌入映射為

【論文解讀 KDD 2018 | HEER】Easing Embedding Learning by Comprehensive Transcription of HIN1 摘要2 介紹3 HEER4 總結參考文獻
，邊嵌入映射為

【論文解讀 KDD 2018 | HEER】Easing Embedding Learning by Comprehensive Transcription of HIN1 摘要2 介紹3 HEER4 總結參考文獻
。
節點嵌入為

【論文解讀 KDD 2018 | HEER】Easing Embedding Learning by Comprehensive Transcription of HIN1 摘要2 介紹3 HEER4 總結參考文獻
，節點對(u,v)由邊嵌入

【論文解讀 KDD 2018 | HEER】Easing Embedding Learning by Comprehensive Transcription of HIN1 摘要2 介紹3 HEER4 總結參考文獻
表示。

（3）HIN的綜合轉錄

學習到盡可能多的HIN中的豐富資訊用于表示，并且不需要額外的專家知識、特征工程，也不需要監督。

3.2 The HEER Model

學習到的HIN的嵌入表示應該對語義資訊進行了有效的編碼，是以應有重構HIN的能力。HEER模型使用邊的表示，不僅能夠預測兩節點間是否有邊，還能推斷出邊的類型。

為了讓HEER能夠處理無向圖和有向圖，節點嵌入根據出入度被分成了兩部分：

【論文解讀 KDD 2018 | HEER】Easing Embedding Learning by Comprehensive Transcription of HIN1 摘要2 介紹3 HEER4 總結參考文獻

。基于節點嵌入的邊嵌入表示如下：

【論文解讀 KDD 2018 | HEER】Easing Embedding Learning by Comprehensive Transcription of HIN1 摘要2 介紹3 HEER4 總結參考文獻

已知邊的嵌入表示

【論文解讀 KDD 2018 | HEER】Easing Embedding Learning by Comprehensive Transcription of HIN1 摘要2 介紹3 HEER4 總結參考文獻

的條件下，定義節點對(u, v)的typed closeness如下，其中

【論文解讀 KDD 2018 | HEER】Easing Embedding Learning by Comprehensive Transcription of HIN1 摘要2 介紹3 HEER4 總結參考文獻

表示類型為r的邊向量：

【論文解讀 KDD 2018 | HEER】Easing Embedding Learning by Comprehensive Transcription of HIN1 摘要2 介紹3 HEER4 總結參考文獻

為了衡量嵌入表示重構HIN的能力，需要針對邊類型r最小化權重和typed closeness的差異：

【論文解讀 KDD 2018 | HEER】Easing Embedding Learning by Comprehensive Transcription of HIN1 摘要2 介紹3 HEER4 總結參考文獻

将式（1）帶入式（2），最終的目标函數如下：

【論文解讀 KDD 2018 | HEER】Easing Embedding Learning by Comprehensive Transcription of HIN1 摘要2 介紹3 HEER4 總結參考文獻

模型如下圖所示：

【論文解讀 KDD 2018 | HEER】Easing Embedding Learning by Comprehensive Transcription of HIN1 摘要2 介紹3 HEER4 總結參考文獻

該模型結構，輸入是一個異質網絡，之後網絡中的節點使用index表示，通過F網絡學習出node embedding，之後通過g函數來學習出邊的embedding，最後通過type之間的相似度，也就是定義的相似度函數和原始連接配接關系共同作為ground truth，最後訓練出網絡參數，進而能夠學到網絡的嵌入模型。

由于式（1）的分母計算複雜。是以采用負采樣的方法縮短計算時間。每次(u, v)之間類型為r的邊，都以正比于權重的機率從HIN中采樣。得到K個負樣本節點對

【論文解讀 KDD 2018 | HEER】Easing Embedding Learning by Comprehensive Transcription of HIN1 摘要2 介紹3 HEER4 總結參考文獻

和K個負樣本節點對

【論文解讀 KDD 2018 | HEER】Easing Embedding Learning by Comprehensive Transcription of HIN1 摘要2 介紹3 HEER4 總結參考文獻

。損失函數計算如下：

【論文解讀 KDD 2018 | HEER】Easing Embedding Learning by Comprehensive Transcription of HIN1 摘要2 介紹3 HEER4 總結參考文獻

作者使用mini-batch随機下降最小化帶有負采樣的損失函數，并且使用LINE預訓練的節點嵌入初始化為HEER中的節點嵌入，μr

【論文解讀 KDD 2018 | HEER】Easing Embedding Learning by Comprehensive Transcription of HIN1 摘要2 介紹3 HEER4 總結參考文獻

初始化為值全為1的向量。

4 總結

HEER模型提出了HIN中由于類型不同而導緻的語義不相容性，使用邊的表示和不同的度量空間表示解決了這一問題，想法很有新意。

HEER不光學習到了節點的表示，還學習到了邊的表示。

但是HEER模型也有一定的局限性，沒有充分利用HIN的複雜結構資訊，隻考慮到了節點對（節點的一階鄰居）來生成嵌入表示。要想利用更複雜的資訊，可能還需要基于元路徑的方法或者是其他新方法。

實驗隻進行了邊重構這一個任務，有些單一，不知道在其他典型的任務上效果如何。

參考文獻

[1] Yu Shi, Huan Gui, Qi Zhu, Lance Kaplan, and Jiawei Han. 2018. AspEm: Embedding Learning by Aspects in Heterogeneous Information Networks.. In SDM.

【論文解讀 KDD 2018 | HEER】Easing Embedding Learning by Comprehensive Transcription of HIN1 摘要2 介紹3 HEER4 總結參考文獻

目錄

1 摘要

2 介紹

2.1 動機

2.2 作者分析了現有的一些方法

2.3 挑戰

2.4 貢獻

3 HEER

3.1 一些定義

3.2 The HEER Model

4 總結

參考文獻

繼續閱讀

深度學習模型或者相關概念的論文出處（持續更新中...）

使用中文維基百科進行GloVe實驗

從詞向量衡量标準到全局向量的詞嵌入模型GloVe再到一詞多義的解決方式衡量标準Evaluation引子全局向量的詞嵌入應用對一詞多義的思考Reference

NLP︱進階詞向量表達（一）——GloVe（理論、相關測評結果、R&python實作、相關應用）一、理論簡述二、測評三、Glove實作&R&python四、相關應用

GloVe與word2vec的差別，及GloVe的缺陷

更别緻的詞向量模型(一)：simpler glove

glove_python安裝（避免編譯錯誤）

python 分析qq聊天記錄

[一起學BERT]（一）：BERT模型的原理基礎Self-Attention機制理論Multi-head Self-Attention注意力機制位置編碼Transformer理論BERT理論

ELMO BERT GPT

BERT、Elmo、GPT一、發展曆史二、bert三、ERNIE四、GPT—transformer的decoder

MICCAI2020論文下載下傳擷取

醫學圖像最新相關研究方向、論文下載下傳及其思考---MICCAI2019論文

論文：Hourglass Module相關整理

軟考-高項-論文-資訊系統項目的風險管理

人工智能如何有效地運用于自然語言處理