安防,是目前人工智能企業(yè)營收最多的行業(yè)之一。
在高清監(jiān)控攝像頭數(shù)量與AI滲透率不斷遞增的情況下,由攝像頭采集的圖像、視頻流數(shù)據(jù),需要更強大的計算引擎對其進行傳輸、存儲、訓(xùn)練和分析。
在現(xiàn)階段的各類安防項目中,依靠智能DVR和NVR顯然無法滿足這些要求;而穩(wěn)定性和安全性都欠佳的X86服務(wù)器,由于基于PC機體系結(jié)構(gòu),也很難在安防企業(yè)級服務(wù)器市場有驚艷表現(xiàn)。
那么人工智能時代下的安防行業(yè),到底需要什么樣的服務(wù)器? 針對一系列問題,雷鋒網(wǎng)人工智能開發(fā)者與學(xué)術(shù)社區(qū)“AI研習(xí)社”,特地設(shè)立《AI安防行業(yè)到底需要什么樣的服務(wù)器?》主題問答,發(fā)起討論。
我們也邀請了浪潮商用機器OpenPOWER產(chǎn)品營銷部總監(jiān)張琪針對用戶們的問題進行解答,浪潮商用機器作為業(yè)內(nèi)少有的可提供安防視頻分析軟硬件服務(wù)器一體機的企業(yè),對AI安防需求有著深刻的理解。與此同時,以“海、大、宇”為代表的傳統(tǒng)安防公司、以“CV四小龍”為代表的AI公司、的眾多專家,也從自己的角度對用戶提出的諸多問題進行回答,雷鋒網(wǎng)AI研習(xí)社節(jié)選了4大主題的9個問題,予以呈現(xiàn):
一、AI安防服務(wù)器的需求
1.現(xiàn)階段大部分安防公司使用的什么樣的服務(wù)器,既能滿足安防企業(yè)現(xiàn)有的需求,同時也能應(yīng)對好未來的AI算力需求?
李迪:
作為安防公司技術(shù)高管,之前X86服務(wù)器一直都是我們采購的首選。
當下的問題是,各科成績都達標的 X86服務(wù)器,在很多業(yè)務(wù)要嵌入AI時,遇到蠻多棘手的問題。
從安防用戶實際使用角度考量,目前X86服務(wù)器應(yīng)用在安防行業(yè)主要存在三大問題:
CPU負責(zé)邏輯運算的單元并不多,在多任務(wù)處理時效率低下。面對海量視頻信息,傳統(tǒng)X86服務(wù)器單純以CPU為核心的數(shù)據(jù)中心部署已經(jīng)不能很好地滿足并行靈活計算、多變環(huán)境的計算需求,很難在安防企業(yè)級服務(wù)器市場有驚艷的表現(xiàn)。
以前的視頻數(shù)據(jù)只需存在后臺,做少量分析即可,也就是說存儲足夠大就行;今天,很多客戶都希望我們能夠?qū)崟r處理這些海量視頻信息并反饋結(jié)果,而這就意味著系統(tǒng)需要同時做解碼、做視頻結(jié)構(gòu)化、做識別、搜索等等,X86明顯就不夠用了。
換句話說,X86可以類比手機里的功能機,它能夠滿足單一的通信處理需求,而AI融入的安防市場,更需要一臺強大的智能手機,配備更強大的性能以適配游戲、圖片處理等個性需求。
越來越多新應(yīng)用的出現(xiàn),傳統(tǒng)的X86計算架構(gòu)會遇到很多瓶頸,包括數(shù)據(jù)瓶頸(處理器的計算單元以多快的速度獲取和交換數(shù)據(jù))、計算瓶頸(單位空間內(nèi)能集成多少計算能力)、延遲瓶頸、通信瓶頸。
就像設(shè)計時速30碼的道路難承載均速100碼的車輛通行一樣,很短時間內(nèi)就可造成道路擁堵甚至癱瘓。
今天來看,面對大計算、智能化場景,什么樣的服務(wù)器+軟件解決方案,能夠最先解決算力問題,又能夠更好降低功耗與成本,這就是好產(chǎn)品。
胡曉:
1.未來城市大腦級的安防網(wǎng),對檢索、比對、實時三維建模的運算能力要求極高
2.人車結(jié)構(gòu)化數(shù)據(jù)增多,安全性會越來越重要
3.需要更大效能的傳輸,未來實現(xiàn)圖像特征編碼能力
4.前端越來越智能,后端存儲需求可能會下降
總體而言,服務(wù)器需適應(yīng)這四大問題。
二、為什么客戶方需要服務(wù)器公司提供的軟硬件一體解決方案?
1. 服務(wù)器廠商打造的安防AI軟硬件一體機端到端解決方案,相比于AI公司開發(fā)的方案,有哪些優(yōu)勢,有哪些難點需要攻破?
李志鵬:
現(xiàn)在基于人工智能的生態(tài)則有個特點,主要是在于生態(tài)的多樣性和不成熟。從數(shù)據(jù)清理開始,導(dǎo)入算法,通過框架建模,形成一個人工智能的應(yīng)用,傳統(tǒng)客戶沒辦法直接使用人工智能應(yīng)用,整合復(fù)雜性更高。
所以服務(wù)器公司給客戶提供端到端軟硬件解決方案,在現(xiàn)階段是符合商業(yè)規(guī)律的,單機銷售模式目前還挺難走通。只能說這種模式比單機更有優(yōu)勢,但相比AI公司,真不好說。
鐘林:
AI公司的優(yōu)勢在應(yīng)用層的算法性能方面,服務(wù)器公司的優(yōu)勢在整體成本層。各有優(yōu)劣,所以具體看場景吧,復(fù)雜場景動態(tài)人臉找AI公司,其他簡單的場景找服務(wù)器公司。
包翰霽:
其實做一體機方案的服務(wù)器公司比較少,以浪潮商用機器的視頻分析方案為例,他們的方案因為提供的是一整套軟硬件產(chǎn)品,尤其是算力模塊和軟件包、圖像定制化開源框架,所以適用的場景更加寬泛,受限的環(huán)境條件要更小,包括光照條件差,監(jiān)控設(shè)備的老舊和攝像頭清晰度不夠的問題,浪潮的方案都能蠻好地適應(yīng)這些問題。能夠最大程度上利用好客戶現(xiàn)有的設(shè)備。
難點在于浪潮在人臉識別的單點場景上和CV四獸比起來性能上還有差距,不過我上次聽浪潮的思路是,尋找合適的AI獨角獸合作,互相補足,一起打造好的方案。
2. 安防行業(yè)人臉比對嫌疑人檢測服務(wù)等,后端都是有大量的數(shù)據(jù)在支撐,并且這些數(shù)據(jù)在快速增長。這些客戶都在用分布式存儲來承載這些數(shù)據(jù)。所以分布式存儲要求有很好的彈性擴展性和高并發(fā)響應(yīng)能力,這就對集群內(nèi)的單節(jié)點存儲容量,存儲讀寫速度和集群內(nèi)節(jié)點間通信速度都有較高要求。那么現(xiàn)在AI安防項目需要什么樣的存儲服務(wù)器呢?分布式存儲解決方案可以解決安防中的哪些痛點?
孫鐘前:
我們部署過分布式存儲方案來管理海量非結(jié)構(gòu)化數(shù)據(jù),目前來看,它的確可以很好地應(yīng)對包括云、大數(shù)據(jù)、智能分析等諸多安防實際場景。”
之前行業(yè)中較為常見的存儲方案大概包括DAS、NAS、SAN(IP SAN&FC SAN)等,眼下,以上幾種方案在實際應(yīng)用過程中已經(jīng)遭遇一些發(fā)展瓶頸。
譬如NAS本身的系統(tǒng)瓶頸,存在單點故障以及性能問題,網(wǎng)絡(luò)協(xié)議還會帶來額外的IO開銷,很難滿足安防AI對大規(guī)模數(shù)據(jù)高存取速率的需求。
再譬如SAN一般是將塊設(shè)備提供給不同服務(wù)器使用,但服務(wù)器之間要共享數(shù)據(jù)仍然需要上層軟件來控制。雖然一些基于SAN的共享文件系統(tǒng),如Veritas、CXFS等軟件利用元數(shù)據(jù)服務(wù)器控制數(shù)據(jù)訪問,但元數(shù)據(jù)服務(wù)器本身也是潛在的瓶頸。
就安防行業(yè)來說,相比此前較為常見的傳統(tǒng)存儲方案,基于GPFS的分布式存儲服務(wù)器解決方案在大規(guī)模集群應(yīng)用中優(yōu)勢明顯,未來應(yīng)用前景會越來越廣闊。
張琪:
安防行業(yè)以前對數(shù)據(jù)存儲的主要需求就是數(shù)據(jù)安全,查詢快速,容量大。在安防智能化之后,對存儲服務(wù)器的新增需求就是強大的算力和高吞吐量。
分布式存儲的多節(jié)點備份和高并發(fā)正好可以解決安防領(lǐng)域的數(shù)據(jù)安全和查詢速度的需求;分布式存儲的彈性擴展可以讓客戶按照需求靈活擴容,同時以比集中式存儲更經(jīng)濟的容災(zāi)備份方案進行基礎(chǔ)設(shè)施投資,可以避免客戶一次性投資過大;安防智能化之后,分布式的高IO擴展性正好能夠滿足更強的算力需求。
三、各大重要安防場景,需要什么樣的視頻監(jiān)控解決方案?
1.在車站、機場這類人流較多的封閉場景中,通過識別非人臉特征(穿搭、外形等信息),進行目標對象檢索與跟蹤,往往比人臉來的更有效。一款優(yōu)秀的非人臉信息結(jié)構(gòu)化系統(tǒng),需具備哪些條件? 非人臉結(jié)構(gòu)化系統(tǒng)在哪些場景中比人臉識別更實用?市場上有哪些優(yōu)質(zhì)的解決方案?
謝鵬宇:
視頻結(jié)構(gòu)化的應(yīng)用場景與人臉識別的應(yīng)用場景是互補的,在開放式空間區(qū)域中,很難基于卡口架設(shè)人臉識別攝像頭,而且人群相互之間的遮擋嚴重,無法根據(jù)人臉識別技術(shù)進行識別、定位、追蹤及數(shù)據(jù)整合。而非人像的視頻結(jié)構(gòu)化系統(tǒng)可以在廣角度下捕捉全屏中的目標,通過整體特征對目標進行追蹤,在公安、機場、高鐵、交通領(lǐng)域都具有廣闊的應(yīng)用前景。
張琪:
一款優(yōu)秀的非人臉信息結(jié)構(gòu)化系統(tǒng)需要對各個廠商的視頻設(shè)備和監(jiān)控系統(tǒng)有優(yōu)秀的兼容性和深入的理解。同時也需要優(yōu)秀的對視頻進行結(jié)構(gòu)化處理的能力。
在光照條件差,視頻設(shè)備的清晰度不夠,目標距離較遠,成像較小,以及在廣域監(jiān)控的場景下。非人臉結(jié)構(gòu)化系統(tǒng)都比人臉系統(tǒng)有更好的應(yīng)用。人臉系統(tǒng)在這些較差的條件下很難獲取到有質(zhì)量的人臉信息。
市面上目前只有浪潮商用機器在專注于這一場景提供解決方案。
2.交通大腦車輛調(diào)度和紅綠燈管控,要解決哪些核心難題?
張琪:
智能交通在車輛調(diào)度和紅綠燈管控方面需要解決的高峰實時調(diào)控的問題。如何通過實時路況實時調(diào)整,解決高峰擁堵的問題。方案通過檢測每天各個時段的車輛通行密度,進而繪制整個城市的車輛通行密度圖。然后制定新的紅綠燈變化規(guī)則,調(diào)節(jié)擁堵路段的通行密度,達到調(diào)節(jié)擁堵的效果。
謝鵬宇:
系統(tǒng)做車輛調(diào)度之前有個比較大的難題,就是對異常事件的檢測。除了識別人、車、物以外,還必須要感知事件,平時車流都是正常通行,這樣的數(shù)據(jù)是大量的,而異常數(shù)據(jù)一般是稀少的,所以基于時空異常的檢測,比如車與人相撞、車與車相撞、車與路相撞,人與人相撞等少見問題,其實挺難訓(xùn)練出一個高識別率的模型的。
3.上述場景中,有哪些優(yōu)質(zhì)的定制化深度學(xué)習(xí)開源框架,可以讓數(shù)據(jù)訓(xùn)練和建模更加便捷?
曹國勝:
選擇深度學(xué)習(xí)開源框架?可參考下面這些考量標準:
1、與現(xiàn)有編程平臺、技能整合的難易程度
2、和相關(guān)機器學(xué)習(xí)、數(shù)據(jù)處理生態(tài)整合的緊密程度
3、通過此平臺做深度學(xué)習(xí)之外,還能做什么?
4、對數(shù)據(jù)量、硬件的要求和支持
5、深度學(xué)習(xí)平臺的成熟程度
機器學(xué)習(xí)平臺在功能側(cè)重上是不一樣的,把他們分成四大類:
1.第一類是以 Caffe、Pytorch、MXNet、CNTK 為主的深度學(xué)習(xí)功能性平臺。這類平臺提供了非常完備的基本模塊,可以讓開發(fā)人員快速創(chuàng)建深度神經(jīng)網(wǎng)絡(luò)模型并且開始訓(xùn)練,可以解決現(xiàn)今深度學(xué)習(xí)中的大多數(shù)問題。但是這些模塊很少將底層運算功能直接暴露給用戶。
2.第二類是以 Keras 為主的深度學(xué)習(xí)抽象化平臺。Keras 本身并不具有底層運算協(xié)調(diào)的能力,Keras 依托于 TensorFlow 或者 Theano 進行底層運算,而 Keras 自身提供神經(jīng)網(wǎng)絡(luò)模塊抽象化和訓(xùn)練中的流程優(yōu)化。可以讓用戶享受快速建模的同時,具有很方便的二次開發(fā)能力,加入自身喜歡的模塊。
3.第三類是 TensorFlow。TensorFlow 吸取了已有平臺的長處,既能讓用戶觸碰底層數(shù)據(jù),又具有現(xiàn)成的神經(jīng)網(wǎng)絡(luò)模塊,可以讓用戶非常快速的實現(xiàn)建模。TensorFlow 是非常優(yōu)秀的跨界平臺。
4.第四類是 Theano,Theano 是深度學(xué)習(xí)界最早的平臺軟件,專注底層基本的運算。
單純就安防圖像而言,Caffe目測是最好的選擇。
張琪:
通常大家都使用Tensorflow,Caffe,Pytorch這些深度學(xué)習(xí)開源框架,浪潮商用機器針對市場上主流的框架進行優(yōu)化,使之更適用于安防視頻分析場景,這款框架叫Power AI,浪潮商用機器也特別推出了兩個免費的功能模塊:LMS(Large module support)深度學(xué)習(xí)大模型支持:用于解決超大模型訓(xùn)練的問題,比如高清衛(wèi)星圖片等;DDL(Distributed Deep Learning)分布式深度學(xué)習(xí)模塊:通過更優(yōu)化的算法引擎和預(yù)設(shè)的場景算法去提高訓(xùn)練效率。
4. 為了讓系統(tǒng)適配更多的行業(yè)場景,為了給更多第三方開發(fā)者提供AI開發(fā)平臺,AI安防行業(yè)需要一個什么樣的開放平臺,并能提升服務(wù)器處理的視頻流路數(shù)?
張琪:
AI安防需要能廣泛兼容各種視頻設(shè)備和視頻格式的平臺。以達到充分利舊,保護投資和最大化場景應(yīng)用的效果。浪潮商用機器的創(chuàng)新應(yīng)用優(yōu)選平臺不但可以處理200路視頻影像,更重要的是可以兼容目前客戶購買的各種類型的監(jiān)控設(shè)備。
陳明:
海康最近提出的AI開放平臺重點談到了這么三點:一是它能夠基于很少量數(shù)據(jù),快速生成滿足場景化需求的AI算法;第二是算法訓(xùn)練、編譯、優(yōu)化全部自動實現(xiàn),對零算法基礎(chǔ)的客戶提供一站式服務(wù);最后它基于海康威視的硬件基礎(chǔ),開放了具有強大感知能力的智能產(chǎn)品。
這三個基本條件在任何一個視覺行業(yè)都是通用的。
曹國盛:
換個角度講,對于很多大公司來說,開放平臺是沒有辦法的辦法,開放就意味著損失,別人從哪個角度都可以隨意切入進來;如果不開放,想走數(shù)據(jù)運營的話,就意味著沒有更多人參與,自己一家是無法搞定的。雙刃劍。
趙非明:
開放平臺還有種模式,以華為為例,他們做安防的思路比較簡單,生態(tài)合作、分層解耦,通過上層的影響力,提供一整套的解決方案,自己能夠提供的就自己做,自己做不了就推薦合作伙伴去做。
這種打法能在很短時間內(nèi)威脅到海康的核心利益。分層解耦的提出,就意味著系統(tǒng)不需要統(tǒng)一,用戶在每一層都可以選擇最好的廠商,然后做開放性的接口開發(fā),誰都可以參與項目競爭。
高度成熟的市場一定是用戶導(dǎo)向的,一定是越來越開放。
未來的行業(yè)格局,一定是分層的,各個層面都有專業(yè)的公司,各個細分領(lǐng)域會出現(xiàn)巨頭,但不會出現(xiàn)類似海康這樣的安防全產(chǎn)業(yè)鏈巨頭。
四、什么性能水平的服務(wù)器可支撐AI安防項目的順利落地
1.安防場景中需要處理大量圖像,而圖像占極大的內(nèi)存帶寬,嚴重阻礙了信息傳輸,如何通過新一代的信息傳輸技術(shù)降低帶寬延遲,提高數(shù)據(jù)處理效率?
張琪:
浪潮商用機器的服務(wù)器產(chǎn)品中,OpenPOWER平臺支持PCIE4.0以及NVlink2.0,相對于X86平臺擁有數(shù)倍的帶寬以及更低的延時。在處理多路并發(fā)視頻信息和及時分析上擁有更好的性能表現(xiàn)。
曹國盛:
一般來說,GPU是專為并行計算而設(shè)計的專用協(xié)處理器,通常其內(nèi)部都集成了數(shù)千個高速運算核心。由于GPU通常都可以直接搭配高帶寬存儲器協(xié)同工作,因此比使用一般RAM的CPU運算速度快出一個數(shù)量級。
目前雖然一些企業(yè)和機構(gòu)的數(shù)據(jù)庫已經(jīng)使用了GPU,但普遍存在一個設(shè)計缺陷:其數(shù)據(jù)庫管理方案都是將數(shù)據(jù)庫存儲在CPU一側(cè),當接到用戶的數(shù)據(jù)請求時,將數(shù)據(jù)搬移到GPU一側(cè)進行處理,然后再把處理結(jié)果移回至CPU進行存儲。也就是說,GPU并非真正的系統(tǒng)核心。這種機制決定了即使通過GPU加快數(shù)據(jù)處理速度,但把處理結(jié)果搬回CPU的過程仍然浪費了大量時間。
如果沒有像傳統(tǒng)系統(tǒng)那樣將數(shù)據(jù)全部存儲在CPU一側(cè),而是將GPU作為真正的核心,利用高速緩存機制將盡量多的數(shù)據(jù)直接存儲在多內(nèi)核協(xié)同工作的GPU一側(cè),這樣做的結(jié)果就可避免數(shù)據(jù)搬移過程中耗費的時間,提升了運算效率。
雖然已有相應(yīng)的解決方案去加快GPU與CPU之間的信息流通,但仍舊存在延時等問題。
目前比較前沿的加速CPU與GPU信息交方案是IBM與NVIDIA聯(lián)合研制的NVlink信息交換通道。樓上浪潮商用機器的張琪大牛也談到過NVlink,我從使用者角度再來談?wù)凬Vlink。
GPU和CPU間的數(shù)據(jù)傳輸速度都是一項技術(shù)瓶頸,因為GPU的顯存能夠快速而少量的讀寫數(shù)據(jù),而CPU使用內(nèi)存讀寫則大量而慢速,因此,CPU的傳輸帶寬大于GPU。NVlink通過調(diào)整相應(yīng)架構(gòu),使得GPU和CPU間的傳輸速度獲得巨大的提升。
其實IBM早在幾年前便注意到了這種趨勢,隨后它們與NVIDIA合作,去加快新數(shù)據(jù)中心工作負載的處理速度。經(jīng)過四年的研發(fā),POWER8服務(wù)器聯(lián)合了NVIDIA的Tesla P100 GPU和NVlink互聯(lián)技術(shù),實現(xiàn)了更高的數(shù)據(jù)性能分析和深度學(xué)習(xí)能力提升。早期IBM和NVIDIA技術(shù)如此緊密的結(jié)合使得數(shù)據(jù)流動速度比使用PCIE快了5倍。
NVlink除了可實現(xiàn)GPU-CPU節(jié)點內(nèi)部的高速互聯(lián),同時還能在GPU-GPU甚至CPU-CPU之間形成高速互聯(lián)。
如果服務(wù)計算量大的客戶,一般采用的是GPU集群,這個時候集群中GPU與GPU之間的高速互聯(lián)就非常關(guān)鍵。當然,數(shù)據(jù)庫也并非完全在GPU中處理,也有一小部分會放在CPU中,具體會根據(jù)客戶的成本以及數(shù)據(jù)量等問題來靈活安排。
為了讓GPU集群以及CPU-GPU之間通信順暢,近幾年,在技術(shù)合作上,以IBM和浪潮商用機器為代表的Power系列的產(chǎn)品會為客戶的GPU數(shù)據(jù)庫提供GPU-GPU以及GPU-CPU的NVlink通道機器Minsky。在市場方面,Power會向客戶銀行推廣包含GPU數(shù)據(jù)庫的一體機。
這類客戶分兩種,一種是對方只要打包好的、直接能夠使用的產(chǎn)品,他們只需知道這個引擎如何使用即可,另外一種客戶則要是想要自己買機器、做數(shù)據(jù)庫、做算法,自己搭建人工智能引擎。
過去IBM和現(xiàn)在的浪潮商用機器主要服務(wù)于前者,以一體機的形態(tài)把相關(guān)的人工智能技術(shù)以及GPU數(shù)據(jù)庫進行整合,從而做成企業(yè)級直接使用的、沒有很多指令集、直接連接的產(chǎn)品。
2. 服務(wù)器聯(lián)動多路前端智能攝像機,需要不斷提取大量的人車特征,并傳輸至后臺進行結(jié)構(gòu)化分析和對象識別,后方的服務(wù)器如何保證在極短的時間內(nèi)對高并發(fā)的各類算法和智能分析作出準確回應(yīng)?
張琪:
主要依靠處理器的多核多線程的高并發(fā)性,以及處理器和GPU的高帶寬性。發(fā)揮強大的算力和高吞吐能力去運行算法模型,處理海量數(shù)據(jù)。