平時寫了部落格,除了釋出在自己的部落格上,還會釋出在知乎專欄和 CSDN(簡書已經放棄了),釋出之後會時不時的看看文章的閱讀量等相關資料。由于 CSDN 的背景沒有導出功能,就自己寫了一個,檢視起來比較直覺。
效果展示
首先來看下導出的效果,我是仿照知乎的導出做的,上面是知乎,下面是我寫的工具導出的 CSDN 的資料。
開發背景
1、知乎
上面也說到了,我寫的這個功能是仿照知乎做的,那麼知乎的資料導出功能在哪呢?
前提你的創作者等級需要至少是
Lv3
,點選打開「知乎創作者中心」即可檢視自己的等級。
如果符合條件,依次點選「内容分析」>「文章」>「單篇文章分析」>「導出 Excel」即可導出所有文章的資料。
2、CSDN
CSDN 也有文章的資料分析,點選「博文資料統計:單篇文章分析」即可檢視。
可以看到,也是有導出功能的,但問題是,隻能檢視一段時間内的文章閱讀資料。而我想看到文章所有的閱讀資料,類似于知乎那樣的。
點選「文章管理」可以檢視文章的相關資料,但是這裡的資料不能導出。
既然官方提供了資料,那就自己做個導出功能吧,這就是我開發這個工具的初衷,把所有資料導出為表格,檢視更直覺,也可以進行篩選排序等。
工具使用
說了這麼多,這個工具到底怎麼使用呢?
1、擷取cookie
首先通路「CSDN 文章管理」,打開浏覽器的開發者工具,切換到
Network
頁籤,然後重新整理頁面,通過
XHR
篩選,找到
list
請求的
Request Headers
中的
cookie
并複制。
2、通路工具
點選「CSDN文章資料導出工具」即可通路該工具。
将上一步操作擷取到的
cookie
粘貼到輸入框中,點選導出,等待幾秒即可下載下傳你 CSDN 所有文章的資料,等待時間與文章量有關。
說明
其實有很多通過 Python 爬取網頁來完成類似資料導出功能的,但是我比較熟悉 Java,就自己寫了一個。
工具使用了 CSDN 官方接口,通過
cookie
模拟使用者請求,分頁擷取文章的資料,并且分頁請求的時候做了延時處理,不然速度可以更快。
擷取到所有資料之後,使用阿裡巴巴的「EasyExcel」導出為 Excel 并下載下傳。
聲明:使用者所填寫的 cookie 不會被儲存,且隻用于擷取使用者文章資料,不會用作其他用途。不建議經常使用,也沒這個必要。
這個工具本身也是為了我自己友善開發的,如有侵權,我會及時删除(這句是給 CSDN 官方看的)。
我的部落格使用的是「halo」搭建的,背景能檢視文章的資料,但是也不能導出為 Excel,等有時間我也寫一個類似的導出功能。
歡迎通路的個人部落格:掘墓人的小鏟子