市面主流100G白盒交換機/裸機交換機評鑒指南

一、白盒交換機發(fā)展歷程

如Figure 1.1所示,白盒交換機在過去三十年間得到了快速發(fā)展,其中開放網(wǎng)絡基金會(Open Networking Foundation,ONF)、Linux基金會、開放計算項目(Open Compute Project,OCP)、電信基礎設施項目(Telecom Infra Project,TIP)等開源組織做出了重要貢獻。首先,Linux 1.0 版本于 1994 年正式發(fā)布,2 年后 2.0 版本正式更新,提供了網(wǎng)絡協(xié)議/功能控制的開源框架。用戶可根據(jù)自己的需求,通過修改內核代碼,對網(wǎng)絡功能與協(xié)議進行修改和定制。受此鼓舞,1998年 IBM、Compaq、Dell 等公司陸續(xù)開始商用 Linux 系統(tǒng),其網(wǎng)絡技術及相關生態(tài)開始快速發(fā)展。2008 年,Linux 開始嘗試與交換芯片結合,在數(shù)據(jù)中心場景中提供大容量、高帶寬的域內數(shù)據(jù)傳輸服務。為進一步推動 Linux 交換機商業(yè)發(fā)展,2010 年日本電器(NEC)和惠普(HP)著手研究交換機軟件化技術,推出基于 OVS(OpenVSwitch)的開放軟件交換機,網(wǎng)絡的資源和能力得到前所未有地釋放,網(wǎng)絡運營開始走向自動化、智能化[3]。2011 年,基于交換機軟件化技術,OCP 等組織開始關注交換機虛擬化技術,并于 2013 年開啟了對交換機硬件白盒化的標準化工作,推出了 ONIE(Open Network Install Environment)開放安裝環(huán)境、FBOSS(Facebook Open Switching System)設備管理軟件以及 ODL(OpenDaylight)控制器標準文檔,在 SDN和白盒交換機領域取得了重大突破。2015 年,OCP 成功推出第一款白盒交換機 Wedge,而后各家也開始基于博通,美滿與各大ASIC廠商的硬件制作自己的白盒交換機。與此同時,OVN(Open Virtual Network)虛擬化 SDN 網(wǎng)絡、ONL(Open Network Linux)操作系統(tǒng)、ONOS(OpenNetwork Operating System)控制器以及電信領域 OpenNFV、CORD(Central Office Rearchitected as a Datacenter)等虛擬化、白盒化項目也相繼興起。2016 年至今,白盒設備、軟件操作系統(tǒng)、網(wǎng)絡自動化等技術已得到蓬勃的發(fā)展。微軟推出的 SONiC(Software for OpenNetworking in the Cloud)、惠普推出的 OpenSwitch、AT&T 推出的DANOS(Disaggregated Network Operating System)以及谷歌面向NG-SDN(Next Generation SDN)推出的 Stratum,開源交換機操作系統(tǒng)層出不窮。同時,ONAP(Open Network Automation Platform)、P4Runtime 接口、Trellis 等網(wǎng)絡管控解決方案也呼之欲出,白盒交換機相關的網(wǎng)絡技術空前繁榮。
2023年,距離最早一批上市的白盒交換機的推出也已經(jīng)過去8年之久,15至20年所大批量采購上架的白盒交換機也早已過?;騟ol,而下架后的交換機便以較為劃算的價格大量出現(xiàn)在以Ebay與咸魚為首的線上二手交易平臺中。
二、裸機交換機vs白盒交換機
裸機交換機
裸機交換機只包含硬件,由用戶自主購買或者選擇軟件操作系統(tǒng)。多年來,構建服務器一直是采用的這種方式(有時是PC和筆記本電腦)。用戶自己選擇需要運行的應用程序,然后選擇最能支持該應用程序或最適合的操作系統(tǒng),然后選擇可以在其上運行所有程序的硬件。
裸機制造商主要是臺灣企業(yè),包括Accton,Quanta QCT,Celestica和Delta Computer等公司,這些公司還是許多主流交換機供應商的原始設計制造商(ODM)。實際上,用戶購買的某些裸機交換機與從主流供應商處購買的交換機相同,只是沒有標簽和沒有操作系統(tǒng),且成本也很低。具體硬件上來說控制平面普遍選擇使用X86,但也有少量的Power PC。交換芯片提供廠商主要包括博通、Marvel、barefoot與盛科。存儲器芯片則主要是國外廠商,三星、海力士、鎂光科技與兆易創(chuàng)新
目前,市場上可用的操作系統(tǒng)都是商業(yè)軟件。OCP的開放網(wǎng)絡Linux(ONL)是一個開源開發(fā)平臺,用戶可根據(jù)自身需求在該平臺上構建實際的操作系統(tǒng),開發(fā)人員可以在其基礎上進行二次開發(fā),但是不能將其直接部署到生產(chǎn)網(wǎng)絡中。
白盒交換機
白盒交換機和裸機交換機的概念常常會讓人混淆,兩者不同之處在于,白盒交換機安裝了操作系統(tǒng)。它仍然是一個開放式交換機,因為操作系統(tǒng)和硬件沒有像傳統(tǒng)交換機那樣集成在一起,相當于你是打包購買了一個裸機交換機和一個操作系統(tǒng)。
例如,如果你從Accton的子公司Edge-Core Networks購買交換機,你可能會選擇裸機或者是安裝了DCSS SwitchOS的白盒或安裝了Cumulus Linux的白盒。Juniper提供了一個白盒解決方案OCX1100,與JUNOS打包銷售。Pica8也是提供的白盒解決方案,你可以將其PicOS與交換機一起購買。Big Switch Networks也是白盒供應商,用戶可以打包購買他們的SDN軟件和裸機交換機。

自從軟件定義網(wǎng)絡(SDN)出現(xiàn)以后,市場對白盒交換機的需求越來越大,SDN通過軟件控制器和直接流表轉發(fā)的白盒交換機就可以完成數(shù)據(jù)中心網(wǎng)絡的部署,而且這種網(wǎng)絡部署快、成本低、便于維護,是現(xiàn)有數(shù)據(jù)中心網(wǎng)絡望塵莫及的??偟膩碚f,白盒交換機的市場發(fā)展空間很大,特別是超大規(guī)模云服務提供商的出現(xiàn),其自建云數(shù)據(jù)中心將需要大量的白盒交換機。
白盒生產(chǎn)廠家主要為思科、戴爾、Arista、瞻博網(wǎng)絡、Pica8、Agema Systems、鴻??萍?、Edgecore Networks、天弘科技、新華三、銳捷、華為與星融元數(shù)據(jù)技術。
三、硬件快速入門
以Edge-core 的標志性機型AS7712-32x 32口100G交換機為例,可以大致認識到市面上主流白盒交換機的硬件布局。如圖Figure 3.1,整機由交換板,控制平面,風扇控制板與電源模塊構成,其他主流機型構造也大同小異。

值得注意的是,早期ODM廠家多采用自家定義的控制平面與應用于工控機的COM express模塊,帶來了諸如系統(tǒng)移植與測試等大量的問題。后來,各廠家均轉向了由OCP牽頭研發(fā)的OCM(Open control module)標準,簡化了生產(chǎn)流程,提高了效率。

?

?四、各家實物展示與大致參數(shù)(大部分圖片來自本人與朋友,其余部分出自STH,Ebay與谷歌)
Mellanox
SN2700
32X100G ,噪音較2100/2010來說小,mellanox自家spectrumASIC +x86

SN2100
16X100G,比較吵,但是窄機,簡單改散熱容易過熱,mellanox自家spectrumASIC +x86

SB7700/7790/7800/7890
36X100G,外形和SN2700差不多,但是純IB機,最好不要買到不帶管理的版本,mellanox自家spectrumASIC +x86

SN2010
?18X25G+4X100G,比較吵,但是窄機,簡單改散熱容易過熱,mellanox自家spectrumASIC +x86

Celestica?
DX010
32X100G,早期版本(15-16年生產(chǎn))由于采用了C0步進的Atom C2000的控制平面而會出現(xiàn)不可逆轉的問題,后期17-18年生產(chǎn)的版本已經(jīng)將其修復,博通Tomahawk ASIC+x86

Edge-core(Accton)
as7712-32x
32X100G,智邦(edgecore)的第一代100G白盒交換機,控制板有ppc與x86兩種,博通Tomahawk ASIC

HPE?
JL279A/JL280A? ?Altoline 6960
32X100G,HPE找edgecore OEM的第一代100G產(chǎn)品(其實也就是as7712-32x),可以安裝NVIDIA的cumulus系統(tǒng),博通TomaHawk+x86

R1N25A/R1N26A FM3180?Composable Fabric
48X25G+8X100G,看似是Clelstica?DS2500 的OEM,2.0T的 背板帶寬,應該是博通的第一代TomaHawk ASIC+x86

Wedge100BF-32X
32X100G,facebook的第一代與第二代100g機器都叫wedge100,但是硬件上區(qū)別很大,第一代機器叫wedge100,第二代叫wedge100BF(下圖),第一代是早期定制產(chǎn)品,asic與控制平面的軟件不好適配。二代采用的是博通TmoaHawk+x86

Quanta
T7032-ix1
32X100G,廣達自產(chǎn)的交換機,博通TomaHawk+Atom x86

?T4048-ix8
48X25G+8X100G,廣達自產(chǎn)的交換機,博通TomaHawk+Atom x86

FS
FS N8560-32C
32X100G,博通Trident 3+x86 D-1527

S8550-6Q2C
6X40G+2X100G,窄機,OEM了國產(chǎn)的代工廠,國產(chǎn)盛科ASIC+x86

Dell
Dell S4112F-ON
12X10G+3X100G,窄機,但是很吵,跑著DELL自家的OS10,Maverick ASIC+x86

?Dell S5048F-ON?
48X25G, 6X100G,跑著DELL自家的OS10,Maverick ASIC+x86

PlexXi(已被惠普收購)
PlexXi PX-S3EQ-F | PX-S3EQ | R0872-F0007-01
32X100G 似乎就是Celestica的OEM,博通Tomahawk+x86

五、總結
大批第一代/第二代100G數(shù)據(jù)中心Tor白盒交換機的下架對于Home HPC 以及高端家庭網(wǎng)絡愛好者來說無疑是福音。但是,自2021年以來的經(jīng)濟寒冬已經(jīng)迫使頭部互聯(lián)網(wǎng)與云計算企業(yè)和各大運營商放緩升級設備的步伐,某些企業(yè)已經(jīng)開始回購二手市場內的100G白盒交換機,許多曾經(jīng)看起來十分劃算的100G交換機目前也已經(jīng)無影無蹤。但是功夫不負有心人(不是),歐美以及國內的普通客戶以及回收商對于非品牌OEM的白盒交換機并不看好,于是便會時常有不少合適的價格出現(xiàn)在Ebay、閑魚等二手交易平臺上。
在我個人的體驗上來看,各家大廠的AISC,無論是美滿,還是博通,待機功耗均為160w起步,端口全UP的情況下會去到300w左右的功耗(風扇基本調到一樣轉速,電源損耗基本可以忽略)。而mellanox自家的ASIC則為待機30w,滿載150w。如果已經(jīng)有切實需求而受限于場地的噪音控制時,最好選擇Mellanox家的機器,這樣至少風扇轉速還能拉低一點。至于擔心電費的人,我的評價是別碰。
個人推薦價格
普通100G白盒交換機(特別是不自帶系統(tǒng)的):300刀 -1000刀左右,取決于接口配置和個人信仰
品牌100G白盒交換機(例如Dell與mellanox):1000刀-1700刀左右,取決于接口配置和個人信仰
韭菜窄100G白盒交換機:1500刀左右(不是很推薦購買,接口拓展性差,散熱困難,風扇轉速高,以及沒有冗余熱插拔風扇和電源,如果有強烈桌面需求以及DIY動手能力另說)
最后,還是希望各位認清需求,理性消費
參考文獻
黃韜, 霍如, 劉江, 等. 未來網(wǎng)絡發(fā)展趨勢與展望[J]. 中國科學: 信息科學, 2019, 8(49): 941-948.
劉曦. 數(shù)據(jù)中心網(wǎng)絡 SONiC 白盒技術的發(fā)展趨勢[J]. 通信世界, 2019, No.826(33):44-45. [3] 閆耀華. 云數(shù)據(jù)中心中虛擬交換機 OpenvSwitch 的性能優(yōu)化技術研究及實現(xiàn)[D]. 北京郵電大學, 2017.
Tan L, Su W, Zhang W, et al. In-band network telemetry: A survey[J]. Computer Networks, 2021, 186: 107763.
Ventre P L, Salsano S, Polverini M, et al. Segment routing: A comprehensivesurvey of research activities, standardization efforts and implementation results[J]. IEEE Communications Surveys & Tutorials, 2020.
Bera S, Misra S, Vasilakos A V. Software-defined networking for internet of things: A survey[J]. IEEE Internet of Things Journal, 2017, 4(6): 1994-2008.
Bosshart P, Daly D, Gibb G, et al. P4: Programming protocol-independent packet processors[J]. ACM SIGCOMM Computer Communication Review, 2014, 44(3): 87-95.
He B, Dong L, Xu T, et al. Research on network programming language andpolicy conflicts for SDN[J]. Concurrency and Computation: Practice andExperience, 2017, 29(19): e4218.
Wang S, Meng Z, Sun C, et al. SmartChain: Enabling high-performance servicechain partition between SmartNIC and CPU[C]//ICC 2020-2020 IEEEInternational Conference on Communications (ICC). IEEE, 2020: 1-7.
Vajaranta M, Oinonen A, H?m?l?inen T D, et al. Feasibility of FPGAacceleratedIPsec on cloud[J]. Microprocessors and Microsystems, 2019, 71: 102861.
Singh S K, Rothenberg C E, Patra G, et al. Offloading virtual evolved packet gateway user plane functions to a programmable ASIC[C]//Proceedings of the 1st ACM CoNEXT Workshop on Emerging in-Network Computing Paradigms. 2019: 9-14.
Bari M F, Boutaba R, Esteves R, et al. Data center network virtualization: Asurvey[J]. IEEE communications surveys & tutorials, 2012, 15(2): 909-928.
McCauley J, Liu Z, Panda A, et al. Recursive SDN for carrier networks[J]. ACMSIGCOMM Computer Communication Review, 2016, 46(4): 1-7. 74
Condoluci M, Mahmoodi T. Softwarization and virtualization in 5Gmobilenetworks: Benefits, trends and challenges[J]. Computer Networks, 2018, 146: 65-84.
Nguyen V G, Kim Y H. SDN-based enterprise and campus networks: a case of VLAN management[J]. Journal of Information Processing Systems, 2016, 12(3): 511-524.
左青云, 陳鳴, 趙廣松,等. 基于 OpenFlow 的 SDN 技術研究[J]. 軟件學報, 2013(5):1078-1097.
梅雅鑫, 舒文瓊. 網(wǎng)絡"黑""白"之爭[J]. 通信世界, 2018, No.787(29):16-17.
解云鵬, 王江龍, 雷波. 5G 時代 數(shù)據(jù)中心網(wǎng)絡演進正當時[J]. 通信世界, 2019, No.826(33):34-35.
黃志蘭,樊勇兵,陳楠,何曉武.overlay SDN 實現(xiàn)異構兼容的關鍵技術[J].電信科學,2016,32(11):112-118.
徐雷, 侯樂. ICT 全面融合 白盒開啟運營商網(wǎng)絡轉型之路[J]. 通信世界, 2018, No.787(29):22-23.