您的位置: 旅游網 > 音樂

    壹看板CEO趙乾坤博士新時代商業智能需要

    發布時間:2020-10-15 16:00:41
    壹看板CEO趙乾坤博士:新時代商業智能需要全新解讀

    商業智能是一套完整的解決方案,用來將企業中現有的數據進行有效的整合,快速準確的提供報表并提出決策依據,幫助企業做出明智的業務經營決策。在當今大數據、人工智能等技術爆發的時代,我們又應該怎么解讀適應時代發展的商業智能呢?

    萬物皆為數

    隨著大數據落地的不斷深入,越來越多的企業意識到數據的價值。然而眾人統一的認知,或者是大部分商業智能從業者的認知,都局限在結構化數據的邏輯。也就是說他們認為所有的數據最終都是可以存儲到數據庫的,或者說都是經過采集,清洗,整合后的高質量數據。

    事實上目前數據的定義已經完全超越了數據庫的存儲邏輯,不管是關系型還是最新的NoSQL或者Graph database,目前存儲在數據庫之外的數據量是遠遠超過存儲在數據庫內的數據。

    在商業智能分析中,數據源有網頁,pdf,圖片,音頻,視頻等等都具有很重要的價值。比如在新零售的場景下,我們對于線下商品展示和商品包裝等相關數據的分析需求日益增加。 商品的銷量與他擺放的位置,以及商品包裝的顏色等有何相關性?如何分析?我們是需要提前將所有相關的信息都采集下來然后清洗并結構化存儲以備分析嗎?

    采集和存儲是必須的,但是靠傳統商業智能清洗和結構化那些數據,還是比較困難。隨著技術的發展,我們可以通過成熟的相關分析工具加自定義腳本的方式來靈活分析上面提到的問題,甚至對基于圖片中色彩模式,物體相似度等的檢索和分析都有第三方支持。

    話說回來,新時代的商業智能,對于萬物皆為數該如何理解呢?數據已經不是傳統的數字或者數據庫的邏輯,數據已經是所有物品必須添加的一個新維度或者屬性。同時商業智能分析要突破傳統數據倉庫和數據庫的思路,在商業邏輯之下提出各種開腦洞的數據需求和分析需求。

    數據架構之供應鏈思維

    商業智能中數據架構至關重要,它是所有商業分析的基礎。所謂數據架構就是如何存儲和管理你的數據,在哪里存儲,以及為什么要使用這種管理邏輯。人們通常會直接把這個問題局限在傳統數據庫中的數據建模(關系和數據結構的設計)上,但是數據架構的核心任務是設計一套數據的供應鏈邏輯,讓數據在整個生產、采集整合、分發,消費等環節具備高效的邏輯,這往往不止是一個數據建模的問題。

    并且數據架構也需要解決不同商業場景下對數據分析、數據科學相關數據處理的支持設計。所以數據架構更重要的是梳理和設計出來一套完整的邏輯,在這個抽象層面之下才是具體的存儲和管理,有了目標之后就更容易做出好的數據架構。

    說到商業智能數據架構不得不說一下傳統的數據倉庫。本質上數據倉庫解決的是數據湖的問題,將不同地方的數據整合在一起并實現關聯是數據分析的基礎。一般數據倉庫項目的周期都會比較長,短則半年數月,長則幾年。這個也容易理解,數據倉庫搭建過程中對于數據的打通,清洗,關聯,建模等都不是一項短時間能完成的任務,這個與數據倉庫項目的整體目標有關。如果希望搭建一套完整的滿足各種業務分析需求的,還依賴于現有業務邏輯和數據生產的復雜系統。

    現實情況是不同的數據源甚至是數據維度或者片段對于商業分析的價值是不一樣的。而在這個過程中,對于不同數據預判的缺失導致在整個ETL中的投入過大。后來有了hadoop之后,大家還是一個數據中心的思路,什么數據都往hadoop里面寫,后續要用再來找。這樣也會出現一些問題,比如在數據流的場景下,你會發現很多流式數據很難持續存儲到數據庫中,因為數據采集和數據查詢本身就是兩種不同的場景和階段。

    整體來說數據架構的設計包含四個不同的維度,數據的生產,采集整合,分發,和消費。梳理清楚他們之間的邏輯,以實現通暢的數據供應鏈的目標。其中任何一部分都可以靈活支持各種方式,例如數據的分發,類比線下零售體系,我們會有不同的分發體系來支持不同的渠道,比如中心倉和地方倉,電商倉和渠道倉等邏輯。所以新時代的數據架構可以是一個多條線并行的架構,不一定是一個完全中心化的數據倉庫的設計邏輯。

    商業智能和數據科學

    傳統商業智能的核心目標是數據的復用性,通過星型結構和范式模型的抽象來支持各種數據的存儲、查詢和報表業務。本質上商業智能解決了數據訪問和一部分數據探索的目的,然而他們能支持的問題變化不大所以對應的報表設計相對固定。但是在數據科學中很難有這種不變的數據結構或者計算模型來支持各種不同的算法,即使是算法本身也在不斷地演進的過程中。

    在商業智能系統的設計過程中通過基礎的數據結構來描述所有的事物,然而并不關心背后的業務邏輯,往往是通過通用的描述模型來實現的。比如我們并不知道某商品的銷售總額到底代表什么意義,但是針對這個度量我們支持求和、平均等等一系列的操作。傳統數據倉庫的設計主要是基于需求背后的統一計算模型和邏輯而抽象出來的。

    數據科學相關的分析問題卻很難用統一的抽象結構和計算模型來描述。簡單來說你需要做更多的統計學計算,比如一些相關系數的計算,從向量到矩陣的基本運算等。不止是這些計算的復雜度和資源消耗發生了巨大變化,同時不同的算法背后能被抽象出來的標準計算模型也非常有限。這也就是為什么曾經有大量的數據科學家做特征工程的工作,也就是基于不同的算法和對業務的理解來做特征抽取的工作,然后基于特征抽取來做各種算法的對比試驗。特征工程本質就是從抽象的存儲到抽象的計算模型的一個過渡。

    從本質上來說數據科學的數據架構和傳統商業智能的架構設計的邏輯可以類似。隨著數據倉庫和商業智能的發展,很多方法和框架已經非常成熟,所以現在企業在選擇商業智能和數據科學的時候還有一條中間的道路就是:將數據倉庫(商業智能)作為數據科學的一個數據可訪問性的中間件,然后再基于商業智能和數據科學來設計出不同的數據存儲抽象和數據模型抽象來支持各自的數據架構。

    關于作者:

    趙乾坤 壹看板創始人兼CEO

    鼻塞的原因
    先聲藥業上市
    哪種軟肝藥效果好
    先聲藥業任晉生
    寶寶不消化吃什么
    猜你會喜歡的
    猜你會喜歡的
    主站蜘蛛池模板: 果冻传媒在线观看播放绿野仙踪| 亚洲综合精品香蕉久久网| 朝鲜女人大白屁股ASS孕交| 免费足恋视频网站女王| 国产精品亚洲专区无码不卡| 国产高清在线精品一区| 亚洲中文字幕久久精品无码喷水| 绿巨人草莓香蕉丝瓜菠萝| 国产粗话肉麻对白在线播放| 久久国产精品无码一区二区三区| 男人扒开女人下面狂躁动漫版 | 男人j桶进女人p无遮挡动态图二三 | 日韩色图在线观看| 日本卡一卡2卡三卡4卡无卡| 亚洲欧美日韩在线观看| 精品国产青草久久久久福利| 国产成人av三级在线观看| 91video国产一区| 日本午夜精品一区二区三区电影 | 男女无遮挡边摸边吃边做| 国产精品成人久久久| 一区二区三区视频在线| 日本理论片午午伦夜理片2021| 健身私教弄了我好几次怎么办| 足恋玩丝袜脚视频免费网站| 国产精品永久免费视频| h在线观看免费| 晚上睡不着正能量网址入口| 午夜dy888| 51久久夜色精品国产| 好男人社区神马www| 久久久久亚洲AV成人无码| 激情三级hd中文字幕| 四虎成人精品在永久免费| 天天影视综合网| 国内精品哆啪啪| www.日日爱| 成年人在线免费播放| 久久精品国产99久久无毒不卡| 狠狠躁夜夜躁人人爽超碰97香蕉| 国产成人免费网站在线观看|