有另外一種比較隐蔽的使用者追蹤技術,不使用cookie或者Javascript。很多網站已經在用了,但知道的人不多。本文就來介紹一下這種技術是如何追蹤使用者,使用者又該如何避免追蹤。
這種技術不依賴于:
- Cookies
- Javascript
- LocalStorage/SessionStorage/GlobalStorage
- Flash, Java或插件
- 你的IP位址或者User Agent頭
- Panopticlick
相反,它使用另外一種存儲方式,而這種存儲即使浏覽器關閉仍然能夠存在,那就是浏覽器緩存。 即使你完全禁用了cookie和Javascript,甚至使用VPN服務,這種技術仍然能夠跟蹤到你。
示例
到這個連結(http://lucb1e.com/rp/cookielesscookies/ )上送出一些資料,然後關閉浏覽器,然後再打開,看看資料是不是仍然在那裡?
看一下你的Cookie裡面的有沒有東西?沒有的吧,這些都在我們幾乎沒有察覺到的一個假的圖檔校驗。看一下上面那個眼睛,哈哈,那是我們的追蹤者。
它如何工作?
下圖是一個大緻描述
圖像中的ETag是一種圖像校驗方式,當圖像發生變化的時候,ETag也會随之發生變化。是以,浏覽器會拿着圖檔和ETag去伺服器進行校驗,讓伺服器來應答這張圖檔是否發生改變,如果沒有的話,這張圖檔就直接從浏覽器緩存中命中傳回,無需再去伺服器重新拉取圖檔了。
細心的讀者可能已經大概知道這個是如何可以實作追蹤的:浏覽器把之前的ETag發回到伺服器就OK了。不過,通過這個ETag貌似能産生好多好多Cookie,不是嗎?于是,伺服器可以給每個浏覽器一個唯一的ETag,再次收到這個ETag的時候,就能知道是你了。
Demo中的一些技術細節和缺陷
Demo為了能夠不借助于Javascript,我不得不找出一些資訊對你來說是唯一的,除了那個ETag。圖檔是在頁面加載後加載的,不過隻有圖檔裡面有ETag。我是如何将時間資訊顯示出來呢? 我确實做不用Javascript動态更新資料,而這Demo就是要證明不用依賴Javascript。
一些小bug:
- 所有你看到的資訊都是上一次的。需要按F5才能刷出最新的。
- 當你通路頁面的時候不攜帶ETag (比如隐身模式),會話就會被清空。 或者說,你重新整理頁面的時候,資料就會消失。
我沒有看到這種技術的比較簡單的解決方案。當然有些東西可以做一下,可能其他網站不會用,不過我就是想讓代碼簡單實用就行。
請注意,當你确實想去追蹤某個人,你又不打算告訴使用者他們正在被追蹤,你這些bug是不存在的!
源代碼
哪個程式沒有源代碼? 噢,好像是微軟的Windows。
https://github.com/lucb1e/cookielesscookies
如何避免追蹤?
如果你想更安全一些, 我強烈建議你開啟隐身模式,使用HTTPS。隻要這樣開一下,就能防止BREACH (最新的https攻擊),禁止了cookie跟蹤,也消除本文講到的緩存跟蹤的問題。用網銀的時候,我會使用隐身模式。在Firefox(IE應該也是)按Ctrl + Shift + P,在Chrome中按Ctrl + Shift + N。
除此之外,要看你對于隐私安全的潔癖程度了。
目前,我沒有簡單完美的辦法,因為緩存跟蹤幾乎是無法察覺的,但同時緩存本身很有用,能夠節省時間和金錢。網站将消耗更少的帶寬(你仔細想想,到底是誰會為這些流量買單),你的網頁加載速度更快,尤其是在移動裝置上,将會有很大的差別,如果你沒有一個無限流量的套餐的話,如果你在網速很慢的地方,緩存的效果就更加明顯了。
聽了這些,如果你還是不放心,那麼完全禁用緩存吧。沒有了存儲性狀态或者資訊,任何追蹤都不會發生,就是每次都要重新加載,速度會慢一些,并且我個人并不認為值得這樣做。
Firefox的插件Self-Destructing Cookies有這樣的功能:當你一段時間不使用浏覽器,它就會清空你的緩存。這個插件的定期清空緩存可能是一個不錯的選擇,隻有在通路會話期間會被追蹤,不過反正他們也能夠記錄下哪個IP通路了哪個頁面,是以這是沒有什麼大不了的。不過之後的通路由于緩存被清空(假設跟蹤是基于緩存),看起來都是一個新的使用者,追蹤将無法繼續。
我不知道任何其他能夠定期清除緩存的插件(例如,每72小時一次),但應該是有的。這将是一個很好的方法,這對于99%的使用者都是有用的,因為這個并不會使性能下降太大,同時還限制了追蹤。
更新:我聽說Firefox的插件SecretAgent也有ETag的覆寫,以防止這種類型的追蹤。你可以對于有些站點設定白名單重置緩存,以達到防止追蹤的目的。這個已經确認能夠防止追蹤。SecretAgent 的網站。
譯文連結: http://blog.jobbole.com/46266/