0
“2022年,會是FinOps爆發(fā)元年。”
FinOps(云財務管理/云成本優(yōu)化),這個名詞看似陌生,今年卻已經被騰訊、阿里等互聯(lián)網大廠提及多次。
用一句大白話來說,F(xiàn)inOps的目的,是上云上得更加劃算,讓IT、財務、業(yè)務等部門不至于為了上云這筆糊涂賬打起來。
“確保從云計算中花費的投入獲得最大價值,實現(xiàn)系統(tǒng)、最佳實踐和文化的結合——以提高組織理解云成本和進行業(yè)務權衡的能力。正如DevOps通過打破煙囪和提高敏捷性、實現(xiàn)了開發(fā)的巨大改進一樣,F(xiàn)inOps期望通過將技術、業(yè)務和財務人員與一套新的流程結合在一起,提高云的業(yè)務價值。”
——FinOps的官方定義
在《企業(yè)上云的最大「迷信」:降本增效》一文中,雷峰網就曾提到,不少企業(yè)陷入某種誤區(qū),在上云為業(yè)務提速的同時,誤以為上云必然也帶來成本的降低。但事實上,上云超支、資源閑置浪費的情況比比皆是,與降本增效的初心南轅北轍。FinOps的出現(xiàn),則被認為是上云超支的一劑靈藥。
不過,一個新概念的流傳,必然會伴隨眾多質疑與爭論。雷峰網在采訪調研的過程中,聽到最多的回答是“沒聽說過”“沒有必要”。
有從業(yè)者直言,國內企業(yè)還沒來得及完全消化“云原生”“數(shù)字化轉型”等概念,F(xiàn)inOps只是云廠商對外推銷的又一套新話術。
但也有多位大廠高管向我們強調,工具和技術確實已經長成,但不能提供保障:這就好比一支鋼筆出水再怎么順滑,也不能保證你能寫出一手漂亮的字。
在他們眼中,這并不是一個平地而起的概念;相反,不少企業(yè)的發(fā)展過程中,F(xiàn)inOps的理念已經自然萌芽,只不過是現(xiàn)在找到了更貼切、成體系的表達。
“它不只是某個特定的技術、工具或者解決方案,更是一種上升到組織架構和管理文化層面的實踐?!币晃谎芯縁inOps的云計算從業(yè)者如是說。
究竟FinOps是什么,又為什么非做不可?企業(yè)怎樣才能——或者說,才應該進入到FinOps的世界中?
Gartner此前的一項研究數(shù)據(jù),引起了不少廠商的關注:45%的企業(yè)由于缺乏優(yōu)化措施,在直接遷移上云的過程中會超買 55%的資源,并且在上云初期的18個月內多花費70%。
一家房企的IT負責人就告訴雷峰網,“云服務的‘浪費’,從技術上來說是,無法避免,不可能是‘用多少買多少’,萬一買少了影響業(yè)務運行呢?”
這樣的想法不在少數(shù),也更符合人們的一貫思路,就好比提前囤積物資,以備不時之需??墒聦嵣?,把這種舊想法原封不動地帶進“云時代”,正是造成云成本超支的“元兇”之一。
前廣發(fā)證券首席架構師、凡泰極客CEO梁啟鴻曾向雷峰網強調,在過去,為了對系統(tǒng)負載的波動提供足夠的支持,IT系統(tǒng)總是要按冗余、支持峰值業(yè)務來進行capacity planning(容量規(guī)劃),是一個CAPEX(Capital Expenditure,資本性支出)問題。
而采用云服務,在理想情況下,正是希望將CAPEX變成OPEX(Operating Expense,企業(yè)管理支出),實現(xiàn)“效用計算”:“讓計算效能就像電、水、天然氣一樣隨需隨用,按用度收費?!?/p>
云資源某種程度上就像是“房子”:如今搭建新房的速度確實越來越快,但已建成的新房常常堆滿雜物,或是入住人數(shù)總是遠低于估計值。為了保證總有可用的房間,大量新建確實是個辦法,但新建同樣也要再花費一筆,為什么不同時回頭清理一下那些舊房間?
FinOps的意義,正是讓每一間房發(fā)揮自己的最大價值。
但也有多位IT從業(yè)者向雷峰網提出質疑:FinOps這個說法并不特別,甚至可能會“為了省錢而花錢”。
“上云的收益之一,本就是用戶不再需要持有固定資產進行維護和折舊,相應的成本結構能夠優(yōu)化。上云成本按量付費,可以根據(jù)業(yè)務增長按比例擴大投入,不需要過度超前,過剩的資源也能快速釋放。”
“云原生架構的目的,和FinOps離得不遠,還有必要單獨包裝這么一個新概念嗎?”
在騰訊云FinOps產品負責人孟凡杰看來,云原生技術棧確實提供了一系列提高資源利用率的能力,如對資源更細粒度的管控和分配、自動伸縮能力等,也更靠近隨需隨用、靈活運用的目標。
“理論上來說,業(yè)務遷移到云原生平臺以后,利用率應該大大提升才對。但企業(yè)對云原生的技術認知往往還停留在以前的階段,在虛擬機上怎么用資源,到了云原生平臺照舊,并沒有意識到可以在保證業(yè)務穩(wěn)定的前提下,采用成本更優(yōu)化的手段?!?/p>
就以Kubernetes為例,其提供的原生能力在一些用戶手里并沒有完全釋放。
“比如你是一個平臺側運維人員,你背負著提升平臺資源利用率的 KPI。集群內運行著眾多負載規(guī)律波動的應用,你驚喜地發(fā)現(xiàn),Kubernetes 提供了自動擴容能力,你很想試試看。
“但真正使用了HPA,從負載上升觸發(fā)閾值,到彈性控制器開始擴容,到應用啟動完成,可能有數(shù)分鐘甚至數(shù)十分鐘的滯后,在彈性起作用之前,應用已經被壓垮。于是你拋棄自動彈性能力,繼續(xù)回歸到鎖定超量資源的老路上來?!泵戏步芨锌馈?/p>
利器在手卻難有重用,這只是云資源浪費的冰山一角。Kubernetes集群的CPU利用率偏低,過時不用的研發(fā)項目占用資源,沒有規(guī)模測算能力,超配采購……種種情況都導致了云資源未能得到充分利用。
火山引擎副總經理張鑫則向雷峰網表示,二者其實是完全不同的層級,F(xiàn)inOps應當是更宏大完整的體系。
“一般是公司的財務、采購對成本有直接的關注和要求,甚至是他們KPI的一部分,但研發(fā)、產品團隊通常不背成本指標,‘如何用盡量少的資源達到業(yè)務目標’不是他們優(yōu)先關注的部分。
FinOps最重要的一點,是如何讓財務、采購部門與企業(yè)產品、研發(fā)部門對齊目標,共同為成本負責,落到管理流程和機制上,這并非云原生或某一技術和工具能形成閉環(huán)的。”
那么,是眼下所有的企業(yè)都應該進入到FinOps的實踐中嗎?
“國內大多數(shù)企業(yè)的上云開支,還用不到一套完整的策略和工具,來執(zhí)行如此具體的降本目標。開支已經非常大的時候,企業(yè)才會關注到這一塊?!币晃华毩⒃茝S商的中層如是說。
企業(yè)對上云的關注點確實是循序漸進的,張鑫表示,第一階段企業(yè)關注的,更多是隱私、穩(wěn)定,以及行業(yè)監(jiān)管政策;第二階段則是云與業(yè)務、研發(fā)、管理等體系的適配,關注效率的提升;第三階段,才會來到成本優(yōu)化的層次。
孟凡杰則認為,不少國內企業(yè)還處在業(yè)務遷上云原生的時期,當企業(yè)面對業(yè)務壓力時,成本管控的優(yōu)先級自然會先“放一放”;當業(yè)務趨于穩(wěn)定,應用的容器化、架構的現(xiàn)代化接近完成,也就是時候將關注點轉到成本優(yōu)化上來。
但現(xiàn)狀如此,并不代表這就是理想的狀態(tài)。孟凡杰也直言,云成本優(yōu)化應該從上云的第一天就開始規(guī)劃,并且不斷優(yōu)化。
“我們從現(xiàn)有數(shù)據(jù)發(fā)現(xiàn),有部分的業(yè)務開發(fā)人員對業(yè)務的增長過于自信,申請的云資源超過其真實用量的情況,用戶在為閑置資源買單。很多組織認為忽視了成本對利潤的影響,在上云的過程中,只是把過去的經驗簡單粗暴的套用在新技術棧上。也有眾多團隊武斷地認為成本優(yōu)化和業(yè)務穩(wěn)定性是相背離的,二者只能取其一。”
在國內乃至整個亞太區(qū),F(xiàn)inOps還是相對新鮮的概念,但在歐美,F(xiàn)inOps已形成了一定的討論規(guī)模。孟凡杰透露,除了Linux基金會已經下設FinOps基金會外,歐美一些FinOps主題的峰會也已經達到近千人規(guī)模。
張鑫指出,國外的企業(yè)對云成本的重視程度,之所以更高一些,與國內外的公有云滲透率、云服務的價格體系有著莫大關系。
“尤其是價格和采購模式上,國外的體系更加實時、動態(tài)和復雜。例如云服務連續(xù)使用多久之后自動有梯度價格,或者產生折扣,但在國內,買賣雙方往往是預先談好采購的框架,成本優(yōu)化的空間并不那么大。”
盡管FinOps在國內提及不多,早在2020年12月,信通院就牽頭成立了FinOps產業(yè)推進方陣,推進規(guī)模化實踐。
“很多企業(yè)其實沒有意識到自己已經在涉足FinOps,但他們會用成本的視角來審視每個部門的花費,設資源利用率的紅黑榜,給業(yè)務側做一些施壓。那一步已經邁出去了,只不過暫時還沒有和方法論結合到一起。”孟凡杰說。
也是在2020年,有關上云超支的Gartner報告引起了騰訊云和火山引擎的注意。
在那些率先擁抱云原生的互聯(lián)網大廠內部,云成本優(yōu)化的種子其實早就生根萌芽、形成最佳實踐的方法論。FinOps的出現(xiàn),讓大廠們的優(yōu)化經驗得到了更體系化的表達。
以字節(jié)跳動為例,他們內部已有相關實踐,例如云賬單分析,多云架構下對不同廠商定價策略的審視,推薦、廣告、搜索的在離線任務混合部署等。目前,字節(jié)跳動在云成本優(yōu)化上的最佳實踐,將通過火山引擎對外提供服務。
阿里集團也搭建了自己的混合云資源管理平臺(HCRM),推進自身成本數(shù)字化從無到有的建設,重新疏通集團內部的云資源計費和結算鏈路。
騰訊則走得更快一些。孟凡杰向雷峰網透露,在騰訊內部,云業(yè)務成本中心承擔著FinOps團隊的職責,需要背上資源優(yōu)化的考核指標,從平臺側、業(yè)務側著手,甚至可以向上匯報,通過GM的層級去推動。
團隊也制定了云原生成熟度評估模型,考評集群的利用率等指標,結合彈性、混部等云原生技術對業(yè)務進行改造,成熟度的“分數(shù)”會層層細化下發(fā),具體到每一個運行在Kubernetes集群上的作業(yè)。
對外,騰訊云推出了云原生成本管理產品“成本大師”,從成本洞察、成本優(yōu)化、成本運營三個層面來協(xié)助企業(yè)降本。
2021年11月底,騰訊云宣布加入FinOps基金會,成為國內首家FinOps基金會的頂級成員。這一動作,也讓FinOps走進更多企業(yè)的視野。
騰訊開源聯(lián)盟主席單致豪告訴雷峰網(公眾號:雷峰網),F(xiàn)inOps基金會在2020年8月成立后,他們就一直保持關注,直到開源思路和目的明確、了解清楚Linux基金會在FinOps上的發(fā)展方向后,他們與FinOps基金會執(zhí)行董事 J.R. Storment 和技術咨詢委員會(TAC)主席 Mike Fuller 等一起經過好幾次深度的線上討論會,同步騰訊云的加入目的、發(fā)展戰(zhàn)略,最終達成合作。
此后,騰訊云將參與到圍繞云財務管理最佳實踐的標準制定。單致豪將結合公司整體的開源戰(zhàn)略推進FinOps,孟凡杰則作為騰訊云FinOps產品負責人,從技術層面參與到基金會日常的工作中去。
騰訊也推出了基于云原生技術的成本優(yōu)化開源項目 Crane,將自身內部云資源優(yōu)化流程方法和工具做系統(tǒng)性輸出?!癈rane致力于推薦資源和智能彈性配置,業(yè)務人員無需再為業(yè)務需要多少資源,自動擴縮容應該如何配置等問題而煩惱,Crane會基于業(yè)務的時序變動數(shù)據(jù)給出最優(yōu)解。”孟凡杰介紹。
除此以外,雷峰網也了解到,某手機廠商已經開始了與FinOps相關的實踐;作業(yè)幫、小紅書等企業(yè)也與騰訊云開啟了圍繞FinOps的合作。
在調研的過程中,受訪者們不約而同地達成了一個共識:技術也好,工具也罷,F(xiàn)inOps更應該是一種管理基因,被注入到企業(yè)當中去。
在張鑫眼中,跨團隊的目標對齊、設置類似敏捷教練的FinOps教練角色、設置統(tǒng)一的資源監(jiān)控看板,都是技術之外無比重要的步驟。
孟凡杰則指出,企業(yè)要適應這種新的節(jié)奏,組織架構上就應當有所調整,F(xiàn)inOps團隊得到來自高層的授權和支持,才能真正推動成本優(yōu)化目標的執(zhí)行。
DevOps和敏捷文化的盛行,曾經狠狠打破不少企業(yè)內部的部門墻,如今“新生”的FinOps概念,能夠成功復制DevOps的輝煌,打破企業(yè)轉型的下一道桎梏嗎?
雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。