架構

一個知名網站的微服務架構最佳實現

譯者:藍夢,十余年研發經驗,現就職于某上市互聯網公司。

作者:小馬,Medium 首席架構師。

譯者有話說,如果你的項目正在從單體升級為微服務而憂心;或者你在實踐微服務過程中手忙腳亂,本文都是你不容錯過的好文。

微服務架構的目標是幫助工程團隊更快、更安全、更高質量地交付產品。拆分服務允許團隊快速迭代的同時,保證了對系統剩余部分的最小影響。

在Medium,我們的技術堆棧始于2012年的單體Node.js應用程序。我們已經構建了幾個衛星服務,但我們還沒有制定一個系統地采用微服務架構的策略。 隨著系統變得越來越復雜并且團隊不斷發展,我們在2018年初轉向了微服務架構。在這篇文章中,我們希望分享我們有效地做到這一點并避免微服務綜合癥的經驗。

什么是微服務架構?

首先,讓我們花一點時間來思考微服務架構應該是怎么樣到,不應該是怎么到。 “微服務”是解決那些過載和混亂的軟件工程的手段之一。 我們在Medium至少這樣認為:

在微服務架構中,多個松散耦合的服務協同工作。 每項服務都專注于一個目的,并具有相關行為和數據的高度凝聚力。

該定義包括三個微服務設計原則:

  • 單一職責 – 每項服務應專注于一個目的并做得好。
  • 松耦合 – 服務對彼此知之甚少。 對一項服務的更改不應要求更改其他服務。 服務之間的通信應僅通過公共服務接口進行。
  • 高內聚性 – 每項服務將所有相關行為和數據封裝在一起。 如果我們需要構建新功能,則所有更改應僅本地化為一個服務。

當我們對微服務進行構建模型時,我們應該遵守所有三個設計原則。 這是實現微服務架構全部潛力的唯一途徑。 錯過任何一個都會成為反模式。

  1. 如果缺少單一職責,每個微服務最終會做太多事情,成長為多個“單體”服務。 我們不會從微服務架構中獲得全部好處,我們也會支付運營成本。
  2. 如果缺少松散耦合,對一個服務的更改會影響其他服務,因此我們無法快速安全地發布更改,這本應該是微服務架構的核心優勢。 更重要的是,緊密耦合引起的問題可能是災難性的,例如數據不一致甚至數據丟失。
  3. 如果缺少高凝聚力,我們將最終得到一個分布式單體系統 – 一組混亂的服務,必須同時進行更改和部署才能構建單一功能。 由于多個服務協調的復雜性和成本(有時跨多個團隊),分布式單體系統通常比集中式單體系統差得多。

于此同時,認識到微服務不應該長成那樣,也同樣重要:

微服務不是具有少量代碼行或“微”任務的服務。 這種誤解來自“微服務”這個名字。 微服務架構的目標不是擁有盡可能多的小型服務。 只有符合上述三項原則,服務的提煉就是恰當的。

微服務不是一直使用新技術構建的服務。 盡管微服務架構允許團隊更輕松地測試新技術,但它并不是微服務架構的主要目標。 只有從接偶的服務中受益,團隊才能使用完全相同的技術堆棧去構建新到服務。

微服務不是必須從頭開始構建的服務。 如果您已經擁有一個架構良好的單一應用程序,請避免養成從頭開始構建每個新服務的習慣。 可能有機會直接從單體服務中提取邏輯。 同樣,上述三個原則應該仍然有效。

為什么是現在?

在Medium,我們總是在做出重大產品或工程決策時會問“為什么是現在?”這個問題。 “為什么?”是一個顯而易見的問題,但它假設我們擁有無限的人,時間和資源,這是一個危險的假設。 當你想到“為什么是現在?”時,你突然有了更多的限制 – 對當前工作的影響,機會成本,分心的開銷等等。這個問題有助于我們更好地優先考慮。

我們現在需要采用微服務的原因是我們的Node.js單體應用程序已經成為瓶頸。

首先,最緊迫和最重要的瓶頸是其性能。 某些計算量很大且I / O很重的任務不適合Node.js. 我們一直在逐步改進整體應用程序,但事實證明它是無效的。 它的低劣性能使我們無法提供更好的產品而不會使已經非常慢的應用程序變慢。

其次,重要且有點緊迫的瓶頸是單體應用程序會拖慢產品開發速度。 由于所有工程師都在單個應用程序中構建功能,因此它們通常緊密耦合。 我們無法靈活地改變系統的一部分,因為它也可能影響其他部分。 我們也害怕做出重大改變,因為影響太大,有時甚至難以預測。 整個應用程序作為一個整體進行部署,因此如果由于一次錯誤提交導致部署停滯,那么所有其他更改(即使它們完全正常工作)也無法順利完成發布。 相比之下,微服務架構允許團隊更快地開發和迭代。 因為這些功能與復雜系統是解耦的,所以工程師可以專注于他們正在構建的功能。 自然的,他們就可以輕易安全地做到重大變更。

在我們新的微服務架構中,功能修改后可以在一個小時內發布上線。同樣的,工程師不必擔心它會如何影響系統的其他部分。 項目組的團隊還探索了在開發中安全使用生產數據的方法,這在多年前是無法實現的。 隨著我們的工程團隊的發展,我們有機會去突破現狀。

第三,單塊應用程序使系統很難針對特定任務進行擴展,也很難針對不同類型的任務分離資源問題。使用單一的單塊應用程序,我們必須在整個系統上下擴展,以完成更需要資源的任務,盡管這意味著系統對其他更簡單的任務的準備過度了。為了緩解這些問題,我們分解了不同類型的請求來分離Node.js進程。它們在一定程度上起作用,但不會擴展,因為,同樣,這些微版本的單片服務是緊密耦合的。

最后一點也同樣重要的是,單體架構阻礙了團隊嘗試新技術。 微服務架構的一個主要優點是每個服務都可以使用不同的技術堆棧,并與不同的技術集成。 這使我們能夠選擇最適合工作的工具,于此同時,我們還可以快速安全地完成工作。

微服務策略

采用微服務架構并非易事。 它可能會出錯,實際上會損害工程生產力。 在本節中,我們將分享七個在采用早期階段幫助我們的策略:

  • 建立具有明確價值的新服務
  • 單體數據存儲被認為是有害的
  • 解耦“服務構建”和“服務治理”
  • 徹底和一致的可觀察性
  • 并非每項新服務都需要從頭開始構建
  • 尊重失敗因為它們會發生
  • 從第一天開始就避免使用“微服務綜合癥”

建立具有明確價值的新服務

有人可能會認為采用新的服務器架構意味著產品開發的長時間停頓以及對所有內容的大量重寫。 這是錯誤的做法。 我們永遠不應該為了建立新的服務而建立新的服務。 每次我們建立新服務或采用新技術時,都必須具有明確的產品價值和/或工程價值。

產品價值應以我們可以為用戶提供的利益為代表。 與在單體Node.js應用程序中構建值相比,需要一項新服務來提供值或使其更快地交付值。 工程價值應該使工程團隊更好,更快。

如果構建新服務沒有產品價值或工程價值,我們將其留在單一的應用程序中。 如果十年內Medium仍然有一個支持某些表面的單體Node.js應用程序,那就完全沒了問題。 從單一應用程序開始實際上有助于我們戰略性地對微服務進行建模。

單體數據存儲被認為是有害的

構建微服務的很大一部分工作是對其持久數據存儲(例如,數據庫)進行建模。跨服務共享持久數據存儲通常似乎是將微服務集成在一起的最簡單方法,然而,它實際上是有害的,我們應該不惜一切代價避免它。這就是原因。

首先,持久數據存儲是關于實現細節的。跨服務共享數據存儲會將一個服務的實現細節暴露給整個系統。如果該服務更改了數據的格式,或者添加了緩存層,或者切換到不同類型的數據庫,則還必須相應地更改許多其他服務。這違反了松散耦合的原則。

其次,持久數據存儲不是服務行為,即如何修改,解釋和使用數據。如果我們跨服務共享數據存儲,則意味著其他服務也必須復制服務行為。這違反了高內聚的原則 – 給定域中的行為泄露給多個服務。如果我們修改一個行為,我們將不得不一起修改所有這些服務。

在微服務架構中,只有一個服務應該負責特定類型的數據。 所有其他服務應該通過負責服務的API請求數據,或者保留數據的只讀非規范(可能具體化)副本。

這可能聽起來很抽象,所以這是一個具體的例子。 假設我們正在構建一個新的推薦服務,它需要來自規范帖子表的一些數據,目前在AWS DynamoDB中。 我們可以通過兩種方式之一為新推薦服務提供發布數據。

在單體存儲模型中,推薦服務可以直接訪問單體應用程序所執行的相同持久存儲。這是一個壞主意,因為:

  1. 緩存可能很棘手。如果推薦服務與單體應用程序共享相同的緩存,我們也必須在推薦服務中復制緩存實現細節;如果推薦服務使用自己的緩存,當單體應用更新帖子數據時,我們將不知道何時使其緩存無效。
  2. 如果單體應用程序決定更改為使用RDS而不是DynamoDB來存儲帖子數據,我們將不得不重新實現推薦服務中的邏輯以及訪問帖子數據的所有其他服務。
  3. 單體應用程序具有解釋帖子數據的復雜邏輯,例如,如何確定帖子是否應該對給定用戶不可見。我們必須在推薦服務中重新實現這些邏輯。一旦整體應用程序更改或添加新邏輯,我們也需要在任何地方進行相同的更改。
  4. 即使推薦服務是自己的數據訪問模式的錯誤選項,推薦服務仍然停留在DynamoDB上。

在解耦存儲模型中,推薦服務不能直接訪問發布數據,也不能直接訪問任何其他新服務。發布數據的實現細節僅保留在一個服務中。有不同的方法來實現這一目標。

理想情況下,應該有一個擁有帖子數據的郵政服務,其他服務只能通過郵政服務的API訪問郵政數據。但是,為所有核心數據模型構建新服務可能是一項昂貴的前期投資。

當人員配置有限時,還有一些更實用的方法。根據數據訪問模式,它們實際上可能是更好的方式。在選項B中,單一應用程序可讓推薦服務知道何時更新相關的帖子數據。通常,這不必立即發生,因此我們可以將其卸載到排隊系統。在選項C中,ETL管道生成推薦服務的發布數據的只讀副本,以及可能對推薦有用的其他數據。在這兩個選項中,推薦服務完全擁有其數據,因此它可以靈活地緩存數據或使用最適合的數據庫技術。

解耦“服務構建”和“服務治理”

如果構建微服務很難,那么治理服務往往更難。 當治理服務與構建每個服務相結合時,它會減慢工程團隊的速度,團隊必須不斷重新發明這樣做。 我們希望讓每項服務都專注于自己的工作而不用擔心如何運行服務的復雜問題,包括網絡,通信協議,部署,可觀察性等。服務治理應該與每個服務的實現完全分離。

將“服務構建”和“服務治理”分離的策略是使運行服務任務與服務技術無關,并且使自己的意見,以便應用工程師可以完全專注于每個服務自己的業務邏輯。

由于最近在容器化,容器編排,服務網格,應用程序性能監控等方面的技術進步,“服務治理”的解耦變得比以往更容易實現。

網格化,網格(例如,服務發現,路由,負載平衡,流量路由等)是服務治理的關鍵部分。傳統方法是為每種平臺/語言提供庫。它工作但不理想,因為應用程序仍然需要非常繁瑣的工作來集成和維護庫。通常,應用程序仍然需要單獨實現某些邏輯。現代解決方案是在Service Mesh中運行服務。在Medium,我們使用Istio和Envoy作為sidecar 代理。構建服務的應用工程師根本不需要擔心網絡問題。

通信協議。無論您選擇哪種技術堆棧或語言來構建微服務,從一個高效,類型化(typed),跨平臺且需要最少開發開銷的成熟RPC解決方案開始是非常重要的。支持向后兼容性的RPC解決方案也使部署服務更加安全,即使它們之間存在依賴關系。在Medium,我們選擇了gRPC。

一個常見的替代方案是RESTJSON over HTTP,長期以來,它一直是服務器通信的良好解決方案。但是,盡管該堆棧非常適合瀏覽器與服務器通信,但它對于服務器到服務器的通信效率很低,尤其是當我們需要發送大量請求時。如果沒有自動生成的存根和樣板代碼,我們將不得不手動實現服務器/客戶端代碼。可靠的RPC實現不僅僅包裝網絡客戶端。另外,REST是“固執己見的”,認知存在門檻,但總是讓每個人都對每個細節都達成一致很困難,例如,這個調用真的是REST,還是只是一個RPC?這是一種資源還是一種操作,諸如此類!

部署。擁有一致的方法來構建,測試,打包,部署和管理服務非常重要。所有Medium的微服務都在容器中運行。目前,我們的編排系統是AWS ECS和Kubernetes的混合體,但朝著Kubernetes的方向在走。

我們構建了自己的系統來構建,測試,打包和部署服務,稱為BBFD。它在“跨服務工作一致性”和“為個人服務提供采用不同技術堆棧的靈活性”之間取得平衡。它的工作方式是讓每個服務提供基本信息,例如,要監聽的端口,構建/測試/啟動服務的命令等,BBFD將負責其余的工作。

良好且一致的可觀察性

可觀察性包括允許我們了解系統如何工作的過程,約定和工具,以及在不工作時對問題進行分類。可觀察性包括日志記錄,性能跟蹤,指標,儀表板,警報,并且對于微服務架構的成功至關重要。

當我們從單個服務遷移到具有許多服務的分布式系統時,可能會發生兩件事:

我們失去了可觀察性,因為它變得更難或更容易被忽視。

不同的團隊重新發明了輪子,我們最終得到了零碎的可觀察性,這實際上是低可觀察性,因為很難使用碎片數據連接點或分類任何問題。

從一開始就具有良好且一致的可觀察性非常重要,因此我們的DevOps團隊提出了一致的可觀察性策略,并構建了支持實現這一目標的工具。每項服務都會自動獲取詳細的DataDog儀表板,警報和日志搜索,這些服務在所有服務中也是一致的。我們還大量使用LightStep來了解系統的性能。

并非每項新服務都需要從頭開始構建

在微服務架構中,每個服務都做一件事并且做得非常好。請注意,它與如何構建服務無關。如果您從單一服務遷移,請記住,如果您可以從單體應用程序中剝離微服務并不總是必須從頭開始構建。

在這里,我們采取務實的態度。我們是否應該從頭開始構建服務取決于兩個因素:(1)Node.js適合該任務的程度如何;(2)在不同的技術堆棧中重新實現的成本是多少。

如果Node.js是一個很好的技術選項并且現有的實現很好,我們將代碼從單體應用程序中刪除,并用它創建一個微服務。即使采用相同的實現,我們仍將獲得微服務架構的所有好處。

我們的Node.js單體應用程序的架構使我們可以相對輕松地使用現有實現構建單獨的服務。我們將在本文稍后討論如何正確構建單體應用。

尊重失敗,因為他們會發生

在分布式環境中,更多的東西可能會失敗,而且它們會失敗。 如果處理不當,任務關鍵型服務的失敗可能是災難性的。 我們應該始終考慮如何測試故障并優雅地處理故障。

  • 首先,我們應該期待一切都會在某些時候失敗。
  • 對于RPC調用,需要付出額外的努力來處理故障情況。
  • 確保我們在發生故障時具有良好的可觀察性(如上所述)。
  • 在線提供新服務時始終測試失敗。 它應該是新服務檢查列表的一部分。
  • 盡可能構建自動恢復。

從第一天起避免使用微服務綜合癥

微服務不是靈丹妙藥 – 它解決了一些問題,但創造了一些其他問題,我們將其稱為“微服務綜合癥”。如果我們從第一天開始就不去考慮它們,那么事情會變得很快,如果我們以后再照顧它們會花費更多。以下是一些常見癥狀。

  • 建模不良的微服務造成的傷害大于好處,特別是當你有超過幾個時。
  • 允許太多不同的語言/技術選擇,這會增加運營成本并使工程組織分散。
  • 將運營服務與構建服務相結合,這大大增加了每項服務的復雜性并減慢了團隊的速度。
  • 忽略數據建模,最終得到具有單體數據存儲的微服務。
  • 缺乏可觀察性,這使得難以對性能問題或故障進行分類。
  • 當遇到問題時,團隊傾向于創建新服務而不是修復現有服務,即使后者可能是更好的選擇。
  • 盡管這些服務是松散耦合的,但缺乏對整個系統的全面了解可能會有問題。

我們應該停止構建單體服務嗎?

隨著最近的技術創新,采用微服務架構要容易得多。這是否意味著我們都應該停止構建單一服務?

雖然新技術支持得更好,但微服務架構仍然存在高度復雜性和復雜性。對于小型團隊來說,單一的應用程序通常仍然是更好的選擇。但是,請花些時間來構建單體應用程序,以便以后在系統和團隊成長時更容易遷移到微服務架構。

從單一體系結構開始是很好的,但要確保模塊化并使用上述三種微服務原則(單一用途,松散耦合和高內聚)來構建它,除了“服務”在同一技術堆棧中實現,一起部署并在同一進程中運行。

在Medium,我們在早期的單體應用程序中做出了一些很好的架構決策。

我們的單體應用程序由組件高度模塊化,即使它已經發展成為一個非常復雜的應用程序,包括Web服務器,后端服務和離線事件處理器。脫機事件處理器單獨運行,但使用完全相同的代碼。這使得將一大塊業務邏輯剝離到單獨的服務相對容易,只要新服務提供與原始實現相同(高級)的接口即可。

我們的整體應用程序在較低級別封裝了數據存儲詳細信息。每種數據類型(例如,數據庫表)具有兩層實現:數據層和服務層。

  • 數據層處理對一種特定類型數據的CRUD操作。
  • 服務層處理一種特定類型數據的高級邏輯,并為系統的其余部分提供公共API。服務不共享它們之間的數據存儲。
  • 這有助于我們采用微服務架構,因為一種類型數據的實現細節完全隱藏在代碼庫的其余部分。創建新服務來處理某些類型的數據相對容易且安全。

單體應用程序還可以幫助我們對微服務進行建模,并使我們能夠靈活地專注于系統中最重要的部分,而不是從頭開始為所有微服務建模。

總結

單體Node.js應用程序為我們服務了好幾年,但它開始減慢我們的迭代。我們開始系統地和戰略性地采用微服務架構。我們仍處于這一旅程的早期階段,但我們已經看到了它的優勢和潛力 – 它大大提高了開發效率,使我們能夠大膽地思考并實現大量的產品改進,并解鎖了工程團隊以安全地測試新技術。

謝謝閱讀。如果您有任何疑問或希望更多地討論我們如何開始采用微服務架構,請給我們留言。

原文:https://medium.engineering/microservice-architecture-at-medium-9c33805eb74f

我還沒有學會寫個人說明!

關于InfiniBand知識和架構漫談

上一篇

任正非對話美國思想巨頭:短期預計營收下降300億美元,但2021年華為將重煥生機

下一篇

你也可能喜歡

一個知名網站的微服務架構最佳實現

長按儲存圖像,分享給朋友

ITPUB 每周精要將以郵件的形式發放至您的郵箱


微信掃一掃

微信掃一掃
排球主场论坛