好大用力深一点bl_日本超欲大尺度床戏电影_a级大胆欧美人体大胆666_japanesexxxxx日本54

服務項目:網站建設、仿站、程序開發、APP開發設計、移動網站開發設計、企業網站設計、電子商務網站開發、網站維護、網站推廣、UX/UI 、HTML5、CSS3、JS / Jquery ...
四川浚浚科技有限公司
四川浚浚科技有限公司 (開發設計官網)TEL : 15308000360 / QQ : 38585404

您的位置:首頁 > 技術經驗 > 網站運維 > 正文

消除小型 Web 站點單點故障(Single Point of Failure)
技術支持服務電話:15308000360 【7x24提供運維服務,解決各類系統/軟硬件疑難技術問題】

說起單點故障(Single Point of Failure,SPOF),倒是可以想起電影 《2012》中,一把焊槍把齒輪卡住,從而導致整個艙門無法關閉,進而整個引擎無法發動。這是個有點生動的例子–如此龐大的一個系統,居然因為一把小小的焊槍而險些毀于一旦。投入巨大人力物力生產的救命方舟居然做不到高可用(High availability),這是致命的事情。

大腦對與人來說,就是一個單點,大腦損壞,人也完蛋;手是不是單點? 一只沒了,另一只還能日常生活,從這個角度來說,不是單點。消除單點的最常見的做法:增加冗余。比如,人有兩只手。其次,層次化。當然,分層的目的是便于隔離問題。電影 《2012》 中的這個問題,不知道誰是總架構師,看起來,隔離做得不太夠 :)

一般來說,只要系統能夠比較清楚的分出層次來,要消除單點故障還是有章可循的事情。比如,一個網站,從基礎的硬件層,到操作系統層,到數據庫層,到應用程序層,再到網絡層,都有可能產生單點故障。如果要有效的消除單點故障,最重要的一點是設計的時候要盡量避免引入單點,而隨著架構的變化,定期審查系統潛在單點也是有必要的。

有人或許會問,假設一個起步中的站點,只有一臺服務器,什么東西都在一個盒子里,到底要怎么做呢? 這里的建議是先拋開主板、CPU 、內存這些,首先必須考慮硬盤(存儲層)的問題,如果機器只有一塊硬盤,即使你備份計劃再完善(不要說你的備份也是備份在這塊硬盤上的),還是建議你起碼再弄一塊。做鏡像,讓出錯的概率降低,這是劃算的投入,當然消除單點,成本幾乎不可避免的要增加。如果硬盤多,或者有其他備份機制,可選的方法就更多,別刻舟求劍。

第二個要考慮網卡與網線的單點問題。先說網線,如果要問一個系統里面最容易物理損壞的是哪個組件,答案恐怕非網線莫屬,對于網線這樣多數時候因為距離需要定制的東西,總是購買成品還是有成本的,從我觀察到的情況來看,各個 IDC 的網線使用手工制作的比例不小,這個質量幾乎很難控制,一根線,兩個水晶頭,哪一個出問題都不能正常傳輸。怎么辦? 想辦法提升網線整體質量還是弄兩根網線放在那里? 解決辦法早都有了,網卡綁定 (NIC bonding)一個很簡單很通用的辦法(refer),但是問題是并非很多人在用。多數 PC 服務器應該都是配置了多塊網卡,如果是自己攢服務器,記得網卡多一塊成本沒多大,但是用處會有很多。如果耐著性子看到這里,先別急著去 Google,還有問題呢,兩根網線如何接到上行交換機,什么樣的交換機支持綁定,如何確定綁定是真正生效的? 答案是,嘗試一下。

然后是什么? 是跑多個數據庫,還是跑兩個 Web 服務器,一個不行用另一個頂? 對于單臺服務器,其它能消除單點的地方恐怕收效也不會特別大,現在少做無用功,或許要重點考慮如何備份,如何優化,以及出現問題的時候如何做到快速恢復。有一個或許會引起爭議的建議是,除了 SSH 登錄之外,要不要留一個 Telnet 登錄的服務呢? 畢竟 SSH 服務器端守護進程不是百分百靠譜的事兒,如果 IDC 距離較遠,需要斟酌一下。好吧,網站有了一點發展,用戶量也增加了,感覺需要增加服務器了。再增加一臺服務器,抗風險能力一下子加強了許多,畢竟一臺機器質量再好,也有出錯的時候。現在,Web 服務器、DB 服務器可以考慮引入 HA 的方案,如果單臺服務能力夠,主備模式也不錯。隨著網站的發展,服務器數量繼續增加…

隨著服務器數量的增加,到了必須要自己購買網絡設備的時候了。同樣的設備,一買恐怕就要買雙份,原因無它–一臺總要出錯,哪怕是電源被拔錯–而這樣的情況實際上并不少見。如果預算不夠,那就再等等,但是要記住,定期審查,有可能的話,進行彌補總不會錯。

到現在,所有的服務器都還在一個 IDC 呢,IDC 本身也是個單點啊,服務器被黑怎么辦? 機房光線被施工工人挖斷怎么辦? 機房停電怎么辦? 找第二個機房吧。現在選 IDC 首先要考慮什么? 中國特色的互聯網問題總要考慮吧,”南北互通”怎么樣…或許在選擇第一個機房的時候已經遇到了類似的問題,或許現在正在受到這個問題的困擾。選好 IDC 之后,首先計劃一下數據如何備份過來,然后,網站的配置信息如何同步或備份過來(這是保證第一個 IDC 出了致命問題之后的最基本的恢復要求)。多個 IDC 之后不得不提上議程的要算 DNS 這個事兒了。你的 DNS 解析商靠譜么? 如果域名提供商遭受攻擊,對自己的網站影響能承受么?

更多的服務器,提供更多的應用,更多的用戶,更多的收入… 接下來該怎么辦呢? 現在,您所面對的已經不是一個小型 Web 站點了,可以不用看這篇文章了。

到現在,我還沒說人的問題,如果這些信息只有一個人知道,萬一這個人出了點事情怎么辦? 作為老板,還要考慮人的單點問題。

Updated: DNS 的健康程度檢查重要性應該提升一些。如何檢查?有很多在線的工具可供使用,簡單直接。



上一篇:網站運維之道 關于可用性
下一篇:網站運維之道 之自動化管理

相關熱詞搜索:Arch SPOF