
我知道當你打開這篇 SOP 時,你正急著像熱鍋上的螞蟻。
如果你的服務或是網站遺失資料或是被黑掉照著以下步驟,或許會讓你安心!!
Jul 28, 2017 · 3 min read
開宗名義
墨菲定律:「凡是可能出錯的事,必定會出錯。」
Murphy’s Law : If something can go wrong, it will.
根據以上的墨菲定律,該來的就是會來,你躲也躲不掉。資料被駭、資料遺失或是服務 Shut Down 是在所難免的事情。這 SOP 的目的是讓你在最兵慌馬亂之時給你一點安慰!!
放心,這問題不是只有你會遇到,不少大公司新創公司都會遇到的問題,像是「qollie — 求職天眼通」、「GitLab」。資料遺失是很正常的事情,拍拍。重點在於如何找回備份、開誠佈公與後續防範。
最佳範例
GitLab:
GitLab 是家大型的新創公司,已進入 B 輪融資(2,560 萬美元)。但在 2017/1/31,位於荷蘭的系統管理員因操作失誤而刪除了包含 310GB 產品資料的資料夾,在取消刪除操作後僅剩下 4.5 GB。最扯的事情,運維人員之後檢查發現,網站宣稱和配備的多項備份措施均未正常運作或難以利用。 Gitlab 非常狂地在 YouTube 直播了恢復資料的過程。網站最終遺失了最後 6 小時的資料庫資料(包括問題、合併請求、評論、片段等,不含代碼庫)。
qollie — 求職天眼通:
qollie — 求職天眼通是為了,改善人力銀行被公司所掌控的大問題所誕生的服務,這次資料遺失是因為資料庫遷移時的失誤所造成,更可悲的事情是自動備份等機制都失效了!!遺失了將近兩成的資料,作為一個良好範例他們的確十分的慘,但從臉書回文中可以得知大家並沒有責罵或是反對。作為非常完美的範例,他們迅速的發了公開回覆,詳細的解說了事情發生的經過、遺失的部分,最後提出了解決辦法,請大家一起來把資料補回。
Pokemon GO
這更扯 20000 人超大型活動直接爆炸,不過後續還可以照賺 10 億美金,內如自己按連結看。
步驟(核心概念:意外發生後,主動即時公布狀況和搶修過程)
- 立刻通知用戶遭遇了問題,需要維護或是維修,服務將會暫停。
- 尋找備份,搶修。
- 公布狀況及搶修過程。
- 估計損害範圍。
- 提出解決辦法。
- 通知用戶整件事情的經過、搶修過程、損害範圍、解決辦法、補償辦法。
禁止
- 任何情緒或是具有煽動力的公開言語。
- 欺騙使用者、或是客戶。
- 不負責任的態度!!
後續防範
- 備份!備份!備份!
- 除了要撰寫自動備份外,還要撰寫檢查自動備份是否有正常動作!!
- 正式環境不要交由,沒有經過訓練的新進員工!!
- 要在正式環境修改的部分,必須經過測試環境測試!!
- 對問題使用五個為什麼
