先來看看salesforce是個什麼公司,雲計算企業中的大佬,中國區的網頁是這樣介紹的:
您的所有銷售、服務和營銷資料盡在指尖,但是有将近5小時的資料蒸發了,不好意思哈!
salesforce從1999年到現在,目前salesforce的資料中心在美國東西海岸,日本,新加坡,都柏林。salesforce 連續多年在idc gatner的評比上成為最具創新企業的第一名。據celnet雨花石(salesforce中國區合作夥伴)創始人裘思博(fledman)介紹,“多租戶架構是salesforce的基礎。cloud database用的是oracle的資料庫以及相關技術。在往上分為3個部分,force.com 平台、heroku、wave。”
整個雲資料庫用的是oracle,這個oracle雲資料庫是怎麼丢的資料呢?
我們來看看國外媒體對salesforce的報道。eweek.com 5月11日的文章說:
a salesforce.com database is back up butnot at full capacity. the more than day-long issue left customers frustratedand 5 hours of data permanently lost.
面對衆多客戶的大量抱怨,ceo benioff在twitter上道歉:
i am sorry for our service disruption onna14; please email me [email protected] so we can call you.
salesforce丢失近5個小時客戶資料之後并沒有更明确的賠償或補償,隻是留了一個郵箱而已。
據說這次salesforce發生客戶資料丢失主要因資料中心停電造成,在一個大型資料中心的一次大停電之後,salesforce客戶有近5個小時的資料再也找不回來了:
"we have determined that data writtento the na14 instance between 9:53 utc and 14:53 utc on may 10, 2016 could notbe restored."
對于2015年全财年收入53.7億美元、日事務過13億的salesforce來說,資料丢失的影響無疑是巨大的,客戶的資料啊。
據了解,造成資料丢失的原因是,當機後從業人員希望将資料庫恢複到5小時以前的狀态,但不幸的是,這一操作導緻了故障的發生,進而導緻了資料丢失。但是,salesforce.com的使用者們沒有簽署sla,這也就意味着這樣的故障發生,salesforce将不會給予賠償。當然,這個不是要讨論的重點。
對于使用oracle資料庫的雲服務提供商來說,居然沒有容災,而是考慮用備份來恢複,而且還失敗,把資料都丢了,這是令我最為驚訝的地方。咱不用談oracle公司提供的先進的exadata、oracle cloud machine、zero data loss machine…..(如果你想了解這些先進的東西,可以文章後面留下郵箱),就是傳統的解決方案也很多。
方案一:用oracle goldengate(或者同類産品)
我們在全國許多銀行、交通、電信營運商已經成功實施、穩定運作5年以上了,最大的庫每日單庫日志增量1t左右。做好的秘訣是做好變更管控,每個月做切換演練。我知道很多企業做了之後,維護不好,然後資料不一緻,最終成為擺設的。
方案二:用oracle active data guard(11g以後的版本适用)
适用adg的好處是,不太需要關心源端的變更,而且是實體級别的複制,而且可以适用延遲恢複。事實上,如果條件允許,我們建議最好的容災方案是adg+ogg。
這些技術,對于現在的dba或者說服務公司來說,都是小兒科了。重點的重點是流程,要投入資源保證災備的可用、可靠:
salesforce的遭遇顯然不是個案,隻因為她是雲服務商中亭亭玉立(17歲)的一位,知名度大,是以為衆人所知。君不見,微信群裡經常會出現某某公司又在做非正常恢複了的消息。
如果你的資料庫還沒有做容災或者沒有做好,馬上關注公衆号:dbaplus,免費學習、咨詢切磋~
作者介紹 楊志洪
【dbaplus社群】聯合發起人,新炬網絡首席布道師;
資料管理專家,擁有十餘年電信、銀行、保險等大型行業核心系統oracle資料庫運維支援經驗,掌握itil運維體系,擅長端到端性能優化、複雜問題處理。現主要從事資料架構、高可用及容災咨詢服務;
oracle ace、ocm、《oracle核心技術》譯者。
<b></b>
<b>本文來自雲栖社群合作夥伴"dbaplus",原文釋出時間:2016-05-14</b>