(電子商務研究中心訊) (中國電子商務研究中心訊)從本期開始將會帶大家從微觀的視角,分領域來仔細研究海外大數(shù)據(jù)行業(yè)的各類應用。
今天我們將聚焦于大數(shù)據(jù)的分析、可視化及BI領域。
雖然這三個領域在功能及應用范圍上各有千秋,但實質上可以說是相輔相成:通過大數(shù)據(jù)的基礎分析工具,研究人員可以獲得數(shù)據(jù)內部的邏輯及結果表現(xiàn),但通常這些結果過于復雜并缺乏合理的表達形式,使數(shù)據(jù)科學家及企業(yè)的管理者無法快速領會并對經營活動進行調整。
因此大數(shù)據(jù)的可視化方案應運而生,多數(shù)可視化方案都作為數(shù)據(jù)分析工具的延伸而存在,但也有少部分公司另辟蹊徑,采用非傳統(tǒng)方式將數(shù)據(jù)的可視化更加貼近需求。BI則是大數(shù)據(jù)分析和可視化與業(yè)務場景的結合,作為企業(yè)內部管理工具,使企業(yè)的價值有了極大的增長,成為了大數(shù)據(jù)應用領域重要的一環(huán)。
以上三個領域在國內也有許多優(yōu)秀的企業(yè),我們歡迎該領域的企業(yè)家和投資人與我們一同探討,共同進步。
以下,供你參考。
第一
大數(shù)據(jù)分析領域,在朝向易用、簡單化發(fā)展
大部分大數(shù)據(jù)分析企業(yè)的現(xiàn)狀,可以說是將數(shù)據(jù)的分析、可視化及數(shù)據(jù)的采集、治理、集成進行了一體化,以大數(shù)據(jù)的分析平臺形式存在。例如Fractal Analytics除了具備數(shù)據(jù)分析功能外,還提供自動化數(shù)據(jù)清理及驗證服務,能夠返回標準化的結構化數(shù)據(jù);Voyager Labs則能夠實時采集、分析遍布世界各地的數(shù)十億個數(shù)據(jù)點,幫助用戶進行預測。
上述典型公司主要面向大型企業(yè)進行定制化全流程服務,客單價有時高達千萬美元級別,例如Fractal Analytics的客戶就包括飛利浦、金佰利等大型公司,其高昂的價格及服務令小型企業(yè)望塵莫及。
但隨著大數(shù)據(jù)技術的逐漸普及,SaaS化的大數(shù)據(jù)分析服務將是一個明確的發(fā)展方向,而其使用門檻也將大幅降低,從而將大數(shù)據(jù)分析的能力逐步賦予給中小企業(yè),以真正的實現(xiàn)其基礎資源的價值。同時確保企業(yè)數(shù)據(jù)安全的數(shù)據(jù)脫敏、數(shù)據(jù)保護市場也會隨著SaaS化的到來而逐步拓展出新的市場空間。
目前大數(shù)據(jù)技術簡化、低成本、易用的趨勢已經在部分公司的產品策略上有所體現(xiàn),例如大數(shù)據(jù)分析公司Domino的產品讓數(shù)據(jù)科學家只需專注于自己的分析工作,而不用關注軟硬件基礎設施的建立及維護,Datameer更進一步開發(fā)出的產品屏蔽了復雜的大數(shù)據(jù)分析底層技術,通過類似電子表格的可視化數(shù)據(jù)分析用戶界面,讓企業(yè)的員工能夠快速上手使用,RapidMiner Studio可零代碼操作客戶端,實現(xiàn)機器學習、數(shù)據(jù)挖掘、文本挖掘、預測性分析等功能。
在大數(shù)據(jù)分析能力普及的同時,提升數(shù)據(jù)分析性能、優(yōu)化數(shù)據(jù)分析結果的技術研發(fā)也在快速進展中。例如SigOpt通過自主開發(fā)的貝葉斯優(yōu)化(Bayesian Optimization)算法來調整模型的參數(shù),獲得了比常見的網格搜索(grid searching technique)解決方案更快、更穩(wěn)定、更易于使用的結果,目前SigOpt的產品不僅可以讓用戶測試不同變量,還能夠提供下一步的測試建議,以幫助用戶持續(xù)優(yōu)化改善數(shù)據(jù)分析結果。
令人感到欣喜的是,在大數(shù)據(jù)分析領域還存在著一些顛覆了傳統(tǒng)數(shù)據(jù)分析理論,采用獨特方式方法進行數(shù)據(jù)分析的公司。這類公司的技術對傳統(tǒng)數(shù)據(jù)分析方法進行了很好的補充,在特定領域有著成功的應用。
這類公司中的典型之一是由三位全球頂尖的數(shù)學家創(chuàng)立的Ayasdi,它利用拓撲數(shù)據(jù)分析技術和上百種機器學習的算法來處理復雜的數(shù)據(jù)集,不僅可以有效地捕捉高維數(shù)據(jù)空間的拓撲信息,而且擅長發(fā)現(xiàn)一些用傳統(tǒng)方法無法發(fā)現(xiàn)的小分類,這種方法目前在基因與癌癥研究領域大顯身手,例如一位醫(yī)生利用Ayasdi的數(shù)據(jù)分析技術發(fā)現(xiàn)了乳腺癌的14個變種,如今Ayasdi已經在金融服務和醫(yī)療保健行業(yè)中獲得了相當數(shù)量的客戶。
第二
可視化技術,逐步實現(xiàn)了自動化、智能化
星河研究院在上周的文章中提到,大數(shù)據(jù)可視化是連接數(shù)據(jù)分析結果與人腦的最好途徑,因此可視化技術的高低也成為了左右大數(shù)據(jù)企業(yè)獲客能力的重要因素。目前可視化的發(fā)展方向同大數(shù)據(jù)分析一致,都是朝著簡單、自動化、智能的方向在努力。
典型企業(yè)如Alteryx是一個提供一站式數(shù)據(jù)分析平臺的初創(chuàng)公司,旨在讓用戶在同一個平臺上完成數(shù)據(jù)輸入、建模以及數(shù)據(jù)圖形化等操作,將數(shù)據(jù)運算與精美的圖像完美地嫁接在一起,并能夠和SAS和R語言一樣進行數(shù)據(jù)的統(tǒng)計和分析。
通過可視化幫助用戶實現(xiàn)真正的管理能力提升也是重要的功能之一,德國大數(shù)據(jù)公司Celonis通過流程挖掘技術,從日常記錄中提取數(shù)據(jù)、發(fā)現(xiàn)關鍵因素,并最終揭示公司在業(yè)務中的執(zhí)行情況,能夠幫助客戶公司提高30%的工作效率。
發(fā)展到如今,可視化技術已經不局限于傳統(tǒng)的分析結果展示,而是能夠直接轉換文本、圖片等非結構化的數(shù)據(jù)并直觀展現(xiàn),例如Quid利用機器智能讀取大量文本,然后將該數(shù)據(jù)轉換為交互式視覺地圖,以節(jié)約過去通常會耗費在閱讀檢索中的大量時間。Origami幫助營銷人員將CRM、社交媒體、郵件營銷和調查報告等跨平臺的數(shù)據(jù)整合并進行有效分析,使其簡單化、直觀化、視覺化,人人都能夠高效實用。
同時數(shù)據(jù)分析及可視化對硬件應用的革新也在進行中,本周二我們與星河研究院發(fā)布的文章《向IPO進發(fā)!日志管理分析平臺Sumo Logic獲7500萬美元F輪融資》提到開發(fā)GPU關系數(shù)據(jù)庫服務的Kinetica獲得了5000萬美元A輪融資,采用同一技術路線的MapD也已經能夠做到比傳統(tǒng)計算內核快100倍的速度對大數(shù)據(jù)進行查詢與可視化。
如果希望了解全部的海外大數(shù)據(jù)分析公司詳細信息,請關注公眾號,回復“大數(shù)據(jù)”進行下載
第三
BI技術擺脫“雞肋”,實時、便捷普惠政企效率提升
BI技術的發(fā)展已經有了較長的歷史,但由于技術因素此前一直被限制于企業(yè)內部采集與應用,實際發(fā)揮的效果有限并且使用率不高。如今在數(shù)據(jù)采集與應用范圍普及與大數(shù)據(jù)分析、可視化技術的推動下,通過數(shù)據(jù)儀表板、智能決策等方式提升企業(yè)運營效率利器的BI再次獲得了資本市場的青睞,Tableau作為BI的代表性企業(yè)已經順利IPO目前市值超過48億美元,另一家代表性企業(yè)DOMO估值也達到20億美元,成長速度遠超傳統(tǒng)商業(yè)軟件公司。
相比于可視化技術,BI更偏重于實際的應用,通過模板化、SaaS化及去代碼等方式,BI應用范圍不再局限于數(shù)據(jù)科學家及企業(yè)高管,可預見未來企業(yè)內部每個員工都可以通過BI工具獲知自己及所處部門的各項數(shù)據(jù),并能夠有針對性的改進工作方式與方向。
已經累計融資1.77億美元的Looker令用戶能夠使用自然語言進行查詢,降低了查詢大型數(shù)據(jù)集的門檻;GoodData為企業(yè)提供大數(shù)據(jù)分析SaaS服務,其所有的數(shù)據(jù)分析服務實現(xiàn)了100%云化,企業(yè)可以將公司已有數(shù)據(jù)導入GoodData的云平臺,再對數(shù)據(jù)做跟蹤、切分、可視化、分析等處理。
BI領域一個有意思的應用案例是Qlik公司的產品受到了中國海關總署的高度贊揚。海關總署每天都需要進行龐大的數(shù)據(jù)分析,Qlik則通過圖形化數(shù)據(jù)展示,使海關管理人員不再受平臺和時間的限制,能夠多視角長跨度的分析,實現(xiàn)了對于現(xiàn)有海量數(shù)據(jù)的業(yè)務的快速展示,極大地促進了稽查效果。(來源:星河研究院 編選:中國電子商務研究中心)