企業大數據認證( Enterprise Big Data Certification, EBDC )
企業大數據專業人士 ( Enterprise Big Data Professional, EBDP )
內容簡介
作者介紹
適合人群
你將會學到什麼
購買須知
-
企業大數據認證之路
學會大數據框架六大核心技術,成為企業大數據專家
-
第一章 大數據的介紹
大數據在過去幾年中迅速發展的主要原因是它提供了長期的企業價值,企業可以利用以下五種方式從大數據中獲取價值: 1) 創造透明度 ( Creating transparency ):使用數據來確定未來的決策,會使組織變得更加透明,並打破不同部門之間的壁壘。大數據跨越不同的邊界進行分析,可以識別各種不同的效率。例如,在制造型的企業中,大數據可以幫助確定研發、工程和生產部門的改進機會,從而更快地將新產品推向市場。 2) 數據驅動的發現 (Data driven discovery ):隨著企業以數位形式創建和儲存越來越多的交易數據,因此,可以獲得更多的執行結果的數據。大數據可以利用發現數據集中的模式或趨勢,提供可能尚未確定的新見解。例如,在保險行業,大數據可以幫助確定有利可圖的產品,並提供更好的計算保費的方法。 3) 分段和定制 (Segmentation and customization):大數據分析的結果,提供了一個改進的機會,可以定制某個產品的市場對特定客戶群的影響,從而增加收入。有關客戶行為的數據,可以構建相應的客戶配置文件,因此就更有針對性。例如,在線零售商可以在其網站上定制產品,以匹配當前客戶的需求,因此提高其轉換率。( 譯注:轉換率提高的意思在於網站流量提高,也同時帶動下單的數量 ) 4) 自動化的力量 (The power of automation):分析大數據集的基礎演算法,可用於通過自動化決策取代手動決策和勞動密集型計算。自動化可以優化企業流程並提高準確性或響應時間。例如,零售商可以利用大數據演算法做出購買決策或確定多少庫存,這將會提供最佳回報率。 5) 創新和新產品 (Innovation and new products):大數據可以發現識別新產品需求或增加當前產品或服務設計的模式。通過分析採購數據或搜索量,組織可以識別出自身可能都還不知道的產品需求。例如,大學院校可能會研究他們的網站流量和搜索量,用來預測班級的註冊,並相應地分配教學資源。 一般我們常談的大數據可以分為兩種,第一種是指數據本身,數據很多很多樣而且變化很快。第二種與技術有關,是指一個知識領域,它探索技巧、技能和技術 ( techniques, skills and technology ),從大量數據中推斷出有價值的見解。 大數據本身的特徵通常被稱為四個V: 1)量體 ( Volume ) - 數據量是指需要分析和處理的數據集的大小,現在通常大於 “太字節”和 “千兆字節” ( terabytes and petabytes )。與傳統的儲存和處理能力相比,大量的數據需要獨特和不同的處理技術。換句話說,這意味著大數據中的數據量太大,無法使用常規筆記型電腦或桌上型電腦進行處理。大量數據集的一個例子就是歐洲境內一天的所有信用卡的交易數據。 2)速度 ( Velocity ) - 速度是指數據產生的速度。以這樣極高的速度產生的數據,使得它需要獨特的(分布式、分散式)處理技術。以高速度產生數據的例子就是Twitter消息或Facebook發文,無論何時何地,隨時都有人不斷地發文與按讚。 3)多樣性 ( Variety ) - 多樣性使大數據真的很大。大數據源自各種各樣的來源,通常是三種類型中的一種:結構化、半結構化和非結構化 ( structured, semi structured and unstructured )(如下一節所述)。數據類型的多樣性經常需要不同的處理能力和專業演算法。多樣性數據集的一個例子是在城市的不同位置監控錄影所產生的CCTV聲音和錄影檔案。 4)可信度 ( Veracity ) – 可信度是指正在分析數據的品質。高可信度的數據具有許多對分析有價值的記錄,並且以有意義的方式為整體結果做出貢獻。另一方面,低可信度數據包含高百分比的無意義數據。這些數據的無價值被稱為雜音 ( noise )。高可信度數據集的案例:比方說是來自醫學實驗或試驗的數據。( 譯註:Veracity 也有人翻譯為準確性,也就是說數據的高準確性也代表數據的高品質,也就代表這些數據的高可信度。) 在商業和科學領域,大多數組織都將數據區分成為四種不同的識別模式: 1) 數據分析 ( Data analysis ) 2) 解析 ( Analytics ) 3) 商業智能(Business Intelligence) 4) 大數據 ( Big Data ) 1) 數據分析 ( Data analysis ) 數據分析是一個檢查、清理、轉換和建模數據 ( inspecting, cleansing, transforming, and modeling data ) 的過程,目的是發現有用的資訊,提出結論並支持決策。數據分析在不同的商業、科學和社會科學領域,有多種方面和方法,包括各種名稱下的各種技術。 數據分析 - 從字面意義上說 - 已經存在了幾個世紀(如第1.2節所述)。數據分析的主要目的是審查現有數據,以描述過去發生的模式。因此,它也經常被稱為描述性數據分析 ( descriptive data analysis )。數據分析的一個例子是回顧過去幾年不同商店的銷售模式。 2) 解析 ( Analytics ) 解析是數據中有意義模式的發現、解釋和交流 ( discovery, interpretation, and communication )。在具有資訊被記錄的場域,解析依賴於統計,電腦程式編寫和運算研究的同步應用,來量化性能。 解析包括越來越多的數據科學能力,這其中包括統計學、數學、機器學習、預測建模、數據挖掘、認知計算和人工智慧等 組織需要考慮使用四種類型的解析: 1) 描述型解析 ( Descriptive analytics ):描述型解析或數據挖掘是大數據價值鏈的底層,但它們對於模式的揭開 ( uncovering patterns ),讓洞察力發現 ( that offer insight ),是非常有價值的。描述型分析的一個簡單例子是審 查過去幾個月訪問該公司網站的人數。描述型解析在銷售周期中非常有用,例如,為了發現季節性趨勢並相應地調 整採購決策。 2) 診斷型解析 ( Diagnostic analytics ):診斷型解析用於發現或確定發生事件的原因。例如,在社交媒體營銷活動中,診斷型解析可用於確定某些廣告轉換率提高的原因。診斷型解析為組織提供了有價值的見解,因為它可以幫助他們理解哪些決策會影響公司的績效。 3) 預測型解析 ( Predictive analytics ):預測型解析使用大數據來識別過去的模式以預測未來。根據現有數據集中的趨勢或模式,預測演算法計算某個事件發生的概率。例如,一些公司正在使用預測型解析來進行銷售線索評分,這表明哪些銷售線索將轉化為實際客戶。經過適當調整的預測型解析可用於支持銷售、營銷或其他類型的複雜預測。 4) 指導型解析 ( 規範解析,Prescriptive analytics ):指導型解析是最後和最有價值的解析級別。雖然大數據的解析總體上闡明了一個主題,然而在此時,指導型解析為您提供了類似雷射的焦點來回答特定問題。例如,在醫療保健行業,您可以通過使用指導性解析來衡量臨床肥胖患者的數量,然後添加糖尿病和低密度脂蛋白膽固醇水平等因素,以確定治療重點,從而更好地管理患者人群。相同的指導性模型也可以應用於幾乎任何行業目標群體或問題。( 譯者注:指導型解析是根據預測分析的結果,總結及建議不同結果的優化行動。尤其在大數據時代,指導型解析有助於瞭解現實情況,把握未來機會,確定最佳結果的條件,優化利益或者降低風險。例如Google地圖,當輸入起點和終點,它會計算出數個路線,並把最好的建議呈現在最上面,作為它給使用者的建議。) 3) 商業智能(Business Intelligence) 商業智能(BI)包括企業用於業務資訊數據分析的策略和技術[2]。商業智能使用數據分析 ( analysis ) 和解析技巧 ( analytics techniques ) 來整合和匯總在企業環境中特別有用的資訊。 商業智能的主要挑戰是將不同的企業資訊系統和數據源整合到一個整合的數據倉庫中,在該倉庫中可以執行分析或解析 ( analysis or analytics ) 的操作。數據倉庫是組織中的(大型)集中式資料庫,它結合了來自不同來源的各種不同的資料庫。商業智能的一個例子是建構一個管理儀表板 ( dashboard ),可以顯示出企業不同部門的關鍵效能指標 ( KPI ),既使這些部門分佈於全世界各地。 4)大數據 ( BIG DATA ) 大數據利用數據分析 ( analysis ) 和解析技巧 ( analytics techniques ),並經常使用建立在企業數據倉庫中的數據(如BI中所使用的)。因此,它可以被視為商業智能發展的 “下一步”。 大數據環境中分析的數據大於大多數傳統BI解決方案可以處理的數據,因此需要不同的分散式儲存和處理的解決方案。大數據的特點是其數據源的多樣性,包括非結構化或半結構化數據。例如,大數據解決方案需要能夠處理音頻文件與圖像。
-
第二章 大數據框架
大數據框架是一種結構化方法,由六個核心功能組成。 (1) 大數據戰略 ( BIG DATA STRATEGY ) 數據已成為大多數組織的戰略資產。分析大型數據集和識別數據模式的能力,可以為組織提供競爭優勢。例如,Netflix在決定製作哪些電影或系列影片時,會考慮用戶行為。中國採購平台 - 阿里巴巴,通過數據分析確定為哪些供應商貸款,並在其平台上推薦它們。成為全球巨頭之一。大數據已經成為了一種大的生意。 為了從大數據投資中獲得切實的成果,企業組織需要一個健全的大數據戰略。如何實現投資回報,以及將重點放在大數據分析和分析中的哪些方面?分析的可能性,在實際上是無窮無盡的,組織很容易迷失在浩瀚無盡的數據中。健全和結構化的大數據戰略是大數據成功的第一步。在第3章中,我們將探討大數據的業務驅動因素,並討論如何制定大數據戰略。 (2) 大數據架構 ( BIG DATA ARCHITECTURE ) 為了處理海量數據集,組織應具備儲存和處理大量數據的能力。為了實現這一目標,企業應該擁有資訊基礎架構來促進大數據的處理與分析。因此,企業應該擁有全面的大數據架構來促進大數據分析。企業應該如何設計和建立他們的架構以促進大數據分析呢?從儲存和處理 ( 電腦系統 ) 的角度來看,有哪些要求? 大數據框架的大數據架構元素考慮了大數據環境的技術能力。它討論了大數據架構中存在的各種角色,並著眼於設計的最佳實踐。根據框架獨立於供應商的結構,第4章將介紹與討論美國國家標準與技術研究院(National Institute of Standards and Technology , NIST)的大數據參考架構。 (3) 大數據演算法 ( BIG DATA ALGORITHMS ) 處理數據的基本能力是對統計和演算法有一個全面的瞭解。因此,大數據專業人員需要具備統計和演算法的扎實背景,以從數據中推斷出洞察力。演算法是如何解決一類問題的明確規範。演算法可以執行計算、數據處理和自動推理 ( calculations, data processing and automated reasoning ) 的任務。通過將演算法應用於大量數據,可以獲得有價值的知識和見解。 大數據框架的大數據演算法元素側重於渴望使用大數據的每個人的(技術)能力。它目的是要建立一個包括基本統計操作的堅實基礎,並介紹不同類別的演算法。 第5章簡要介紹了大數據演算法的主題。企業大數據分析師和企業大數據科學家手冊 ( 下一個階段的培訓與認證 ) 中討論了高級統計和機器學習技術。 (4)大數據流程 ( BIG DATA PROCESSES ) 為了使大數據在企業組織中取得成功,有必要考慮的不僅僅是技能和技術。流程可以幫助企業集中精力。流程帶來了結構、可衡量的步驟,並且可以在日常的基礎上進行有效管理。此外,流程通過遵循類似的程序和步驟將大數據專業知識嵌入組織中,將其作為組織的 “實踐” 嵌入。分析這件工作就會降低對個人的依賴性,從而大大提高了長期獲取價值的機會。 第6章概述了適用於每個組織的三個基本大數據流程。它討論了每個流程的效益,並逐步描述了將大數據實踐嵌入組織的流程活動。 (5)大數據職能 ( BIG DATA FUNCTIONS ) 大數據職能涉及管理企業中大數據組織的各個方面。大數據職能的這一要素闡述了組織如何建構自己以建立大數據角色 ( roles ),並討論大數據在組織中的角色和職責。組織文化、組織結構和工作角色對大數據計劃的成功,將會產生重大的影響。因此,我們將利用一些 “最佳實踐” 在設置企業大數據計劃時採用。 在大數據職能章節中,我們討論了大數據的非技術方面。第7章討論了建立大數據卓越中心(Big Data Center of Excellence , BDCoE)的實際方面,並提供了有關BDCoE建立的詳細指導。此外,它還解決了在組織中啟動大數據專案的關鍵成功因素。 (6)人工智慧 ( ARTIFICIAL INTELLIGENCE ) 大數據框架的最後一個元素是人工智慧(AI)。人工智慧是當今世界感興趣的主要領域之一,它提供了一個充滿潛力的世界。在框架的這一部分,我們討論了大數據和人工智慧之間的關係,並概述了人工智慧的關鍵特徵。 大數據框架已被設置為每個人或組織的開放標準,該框架進一步建立在現有理論的基礎上,並總結了大數據中的主要主題和整體的流動。框架的六個要素中,會有一個邏輯順序。序列從框架的中間開始,順時針跟隨框架的六個元素,儘管排序很直接,但重要的是要理解,只有當框架的所有元素都能正常運行,才能實現人工智慧。 大數據成熟度的五點CMM級別: (1) 解析障礙(混亂和臨時活動) - 整個企業當中有極少的分析活動和相關的基礎架構,數據與分析策略都很模糊。 (2) 本地化分析(初始活動) - 整個企業的分析,僅是在孤島中 ( 獨立式的 ) 運作,或是對於數據與分析,都沒有總(體策略。 (3) 分析型作業(可重複活動) - 經過公司高層的支持和承諾,將孤立的功能分析擴展到共享的操作級分析。 (4) 分析型企業(存在於管理的活動) - 數據和分析被視為一種企業優先。該組織正在跨越所有領域開發企業範圍的分析功能,以創建有意義的內容 和想法。 (5) 數據驅動的企業(被優化的活動) - 由具有支持戰略決策的分析,創建具有可信賴洞察力的企業。企業正在收穫利益,並專注於優化分析。
-
第三章 大數據戰略
大數據戰略定義並提出了整個企業的全面願景,並為組織人員採用數據相關或數據依存的能力 ( data-related or data-dependent capabilities) 奠定了基礎。一個定義明確且全面的大數據戰略可以使組織產生效益,並且讓大數據可以落地。 一個定義明確的企業大數據戰略,應該對組織發生作用。為了實現這一目標,組織可以按照以下5步方法制定大數據戰略: 1) 確定業務目標 2) 執行當前狀態評估 3) 確定案例 ( 實際場景 ) 並確定其優先級 4) 制定大數據路線圖 5) 嵌入變革管理 第1步:確定業務目標 為了在任何組織中利用大數據,首先必須完全瞭解企業的業務目標。是什麼讓一個組織成功?收入和利潤通常是達到或超過業務關鍵績效指標(KPI)的結果。在探索大數據技術和解決方案如何增強未來績效之前,首先要瞭解組織的成功程度。 大數據戰略應與公司業務目標保持一致並解決關鍵業務問題,因為大數據的主要目的是通過利用數據來獲取價值。實現此目標的一種方法是與企業戰略規劃流程保持一致,因為大多數組織已經實施了此流程。 第2步:執行當前狀態評估 在此步驟中,主要關注的是評估當前的業務流程、數據源、數據資產、技術資產、能力和企業的政策。本階段的目的是幫助現有狀態和期望的未來狀態,進行差距分析。 例如,如果數據策略的範圍是為了獲得客戶和潛在客戶的全範圍的觀點,那麼當前的狀態評估將包括任何業務流程與數據資產,這其中還包括架構、能力(業務和IT)以及能夠感動客戶的部門策略。目前的狀態評估通常是通過與員工進行一系列訪談來進行的。這些員工曾經參與獲取、保留和處理客戶的經驗。 在這個階段,識別和培養一些數據傳播者也很重要。這些人在決策時真正相信數據的力量,並且可能已經以強大的方式使用數據和進行分析。通過讓這些人參與,要求他們提供意見,在後期制定路線圖時,會變得更加容易。 第3步:確定用例 ( Use cases ) 並確定其優先級 在第3步中,設想預測型解析、指導型解析和最終的認知解析(在第8章中進一步討論)如何通過開發符合步驟1中業務目標的用例 ( 用例,或是翻譯為場景,設計相關的場景來定義自身業務目標的實踐 ) 來幫助組織加速、優化和持續學習。利用場景來瞭解大數據如何實現業務目標, 確定用例優先級的最有效方法之一,就是使用優先級矩陣。優先級矩陣促進業務和IT利益相關者之間的討論和辯論,以確定 “正確的” 用例,而後可以啟動大數據計劃 - 具有意義的業務價值的用例(來自業務利益相關者的觀點)和成功實施的合理可行性。 下面的圖中的優先級矩陣是一個出色的管理工具,用於推動組織協調和圍繞組織最優先使用案例的承諾。 第4步:制定大數據路線圖 下一步可能是最激烈和最有爭議的階段,毫無疑問,在制定數據戰略時,大部分時間都是如此。基於當前的能力狀態評估(步驟2)以及識別和優先處理的大數據用例(步驟3),此時就可以開發路線圖。大數據路線圖概述了首先執行哪些專案(或用例)以及未來3 - 5年內將增加哪些能力(知識,工具和數據)。 考慮到期望的未來狀態,路線圖應側重於識別數據架構、技術和工具、流程以及人員(技能與培訓等)方面的差距。目前的狀態評估和使用案例將為倡議提供多種戰略選擇,下一個任務是根據複雜性、預算和潛在的收益,優先考慮這些選擇。 贊助方和利益相關方將在確定這些舉措的優先次序方面發揮關鍵作用。此階段的最終結果是推出優先大數據計劃的路線圖。 第5步:嵌入變更管理 雖然技術上不是大數據戰略制定的一部分,但變革管理(涉及人們的心靈和思想)將對大數據戰略的成敗產生深遠的影響。 變革管理應包括組織變革、文化變革、技術變革和業務流程變革。數據治理處理數據的可用性、方便性,完整性和安全性的整體管理,成為變更管理的關鍵組成部分。適當的激勵措施和持續的指標應該是任何變革管理計劃的關鍵部分。第7章 - 大數據職能,將進一步討論有關大數據變更管理方面的進一步指導。
-
第四章 大數據架構
NIST大數據參考架構是一種獨立於各種商業廠商的方法,目的就是提供給任何開發大數據架構的組織使用。 NIST大數據參考架構的五個主要角色,代表了每個大數據環境的邏輯組件或角色,並存在於每個企業中: • 系統協作者 ( System Orchestrator ); • 數據提供者 ( Data Provider ); • 大數據應用提供者 ( Big Data Application Provider ); • 大數據框架提供者 ( Big Data Framework Provider ); • 數據消費者 ( Data Consumer )。 五個主要角色被包含在兩個維度中: • 管理 ( Management ); • 安全和隱私 ( Security & Privacy )。 系統協作者 ( SYSTEM ORCHESTRATOR ) 系統協作者是自動安排,協調和管理電腦系統、中介軟體 ( middleware ) 和服務[1]。系統協作者確保大數據環境的不同組件:應用程序、數據和基礎架構都可以協同工作。為了實現這一目標,系統協作者利用工作流程,自動化和變更管理流程。 數據提供者 ( DATA PROVIDER ) 數據提供者角色將新數據或資訊源引入大數據系統,以供大數據系統進行發現、訪問和轉換。數據可以源自不同的來源,例如人類生成的數據(社交媒體)、感測器生成的數據(RFID標簽)或第三方系統(銀行交易)。 大數據應用提供商 ( BIG DATA APPLICATION PROVIDER ) 大數據應用提供商的程序是系統架構組件,其中包含將數據轉換為所需結果所必需的業務邏輯和功能。這些組件的共同目標是從輸入數據中提取值,它包括以下活動: • 收集 ( Collection ); • 準備 ( Preparation ); • 解析 ( Analytics ); • 可視化 ( Visualization ); • 存取訪問 ( Access )。 大數據框架提供商 ( BIG DATA FRAMEWORK PROVIDER ) 大數據應用提供商使用大數據框架提供商所提供的資源和服務,並提供大數據架構的核心基礎架構。在此組件中,數據基於針對大數據環境優化的設計進行儲存和處理。 大數據框架提供程序可以進一步細分為以下子角色: • 基礎設施:網路,計算和儲存 ( networking, computing and storage ) • 平台:數據組織和分發 ( data organization and distribution ) • 處理:計算和解析 ( computing and analytic ) 數據消費者 ( DATA CONSUMER ) 與數據提供者類似,數據消費者在大數據參考架構中的角色可以是實際的最終用戶或另一個系統。在許多方面,此角色是數據提供者的鏡像。與數據使用者角色關聯的活動包括以下內容: • 搜索和檢索 ( Search and Retrieve ); • 下載 ( Download ); • 在本地分析 ( Analyze Locally ); • 報告 ( Reporting ); • 可視化 ( Visualization ); • 用於自己的流程的數據 ( Data to Use for Their Own Processes )。
-
第五章 大數據演算法
大數據是一個知識領域,它探索技巧、技能和技術,從大量數據中推斷出有價值的見解。為了在數據集中找到 “價值”,數據科學家應用了演算法。演算法是關於如何解決一類問題的明確規範。演算法可以執行計算、數據處理和自動推理任務 ( calculation, data processing and automated reasoning tasks )。 演算法的應用及其隨後用於大數據的基礎是統計學的科學領域。因此,參與數據科學的每個人都應該具備關於統計操作的基本知識,以及如何將它們應用於演算法中。因此,本章將討論基本的統計操作,並提供大數據分析和解析解決方案中使用的常見的演算法。 (一)描述統計學 ( Descriptive statistics ) 描述統計學的數據是定量描述或總結了一系列的統計數據,這些統計數據是資訊特徵的摘要。描述統計學的數據提供給快速匯總數據集的關鍵值,並且讓每一位使用數據的人都是容易理解。 例如,籃球中的投籃命中率是一個描述性統計數據,用於總結球員或球隊的表現。此數字是投籃命中的次數除以投籃的總次數。 例如,投籃命中率為33%的球員,大約可以說是每投三次命中一球。百分比總結或描述了多個離散事件,每個人都可以將統計數據與其他玩家的投籃命中率進行比較。 (1)集中趨勢統計 ( CENTRAL TENDENCY STATISTICS ) 集中趨勢統計(或集中趨勢的度量)是數據集中典型的定義。這些統計數據描述了各個數據點如何圍繞其中心 點進行組織。最常見的集中趨勢衡量指標是均值、中位數和眾數 ( mean, the median, and the mode )。 (2)離散統計 ( DISPERSION STATISTICS ) 在統計學中,離散(也稱為可變性,散射或擴散)是分佈被拉伸或擠壓 ( stretched or squeezed ) 的程度。離 散統計資訊表明數據點如何圍繞其中心值分佈。離散統計的度量常見例子是全距,四分位數,變異數 ( 方差 ) 和 標準差 ( range, interquartile range, variance and standard deviation )。 (3)分佈形狀 ( DISTRIBUTION SHAPES ) 分佈是一組數字或函數,顯示出所有不同的數值或變量的結果。換句話說,它顯示了變量的值是如何分佈的。 在大數據分析和解析中,許多常見的分佈被使用到: 頻率分佈 ( Frequency distribution ) 機率分佈 ( Probability distribution ) 採樣分佈 ( Sampling distribution ) 常態分佈、正態分布 ( Normal distribution ) (二)統計推斷 ( Statistical Inference ) 統計推斷是推導數據樣本屬性(即概率分佈)的過程,以便對整個數據組進行預測。如果樣本的某些特徵可以被證明,這些特徵也可能也存在於整個母體 ( population )中。 例如,一項針對500名籃球運動員的研究顯示,NBA中99%的籃球運動員都高於1.95米,可以推斷出NBA中99%的籃球運動員都高於1.95米。這將是基於推論統計的陳述。該陳述是否成立取決於樣本數據是否是整個群體的代表性子集的問題。 關聯 ( Correlation ) 依賴性(或組合性)是兩個隨機變量或雙變量數據之間的任何統計關係,而無論其是否有因果關係。關聯性是一種廣泛類別的統計關係中的一種, 它牽涉到依賴性,儘管它主要用於指示兩個變量是否具有線性關係。關聯性的一個例子是籃球運動員的身高與他們在NBA中的選拔賽選擇之間的關係。 在關聯性中, 兩個 (或更多) 變量相互比較。這些變量可以是互相依賴的, 也可以是獨立的: 自變量 ( Independent variables ) 不會因其他變量的更改而更改或受到影響。它們獨立運行, 並且經常進行更改以測試對因變量的影響。自變量的常見例子是籃球運動員的年齡或身高。 因變量 ( Dependent variables ) 是根據自變量的波動而變化的變量。因變量表示正在研究其變化的輸出或結果。在上面的例子中, NBA 選拔賽的球員入選機會是我們想知道的因變量 (取決於 “籃球運動員身高” 的自變量)。 回歸 ( Regression ) 回歸分析是一組用於估計變量之間關係的統計過程。當焦點放在於因變量與一個或多個自變量(或“預測變量”)之間的關係時,它會利用許多包括用於建模和分析多個變量的技巧。 分類 ( Classification ) 分類是根據一組包含其類別成員身份已知的觀測數據,當作訓練數據,確定新觀測的一組類別中屬哪一類類別的問題。由於電腦進行 “餵送” 樣本數據,因此分類是監督機器學習的一種形式。 分類演算法 - 簡單說明 : 向電腦提供樣本數據,該樣本數據包含關於每個數據點的類別資訊。例如,它學會將胡蘿蔔歸類為 “蔬菜”,將橘子歸類為 “水果”。 在機器 “訓練” 之後,向電腦提供新數據或觀察結果。 電腦現在開始自行分類。在該例子中,具有與胡蘿蔔相似特性的食物將被標記為 “蔬菜”,而具有與橘子類似特徵的食物將被標記為 “水果”。 聚類 ( Clustering ) 聚類分析或聚類是對一組對象進行分組的任務,使得同一組(稱為聚類)中的對象(在某種意義上)與其他組(聚類)中的對象更相似(在某種意義上)。 與分類不同,聚類是非監督學習的一個例子。沒有樣本數據可以送入機器,但電腦開始根據各組之間的相似性來制定群集。為了達成聚類,電腦需要運行聚類演算法。根據要解決的問題的特徵,有許多已知的聚類演算法可用。一個共同點是,大多數聚類演算法都會查看數據點之間的“相似性。 異常值檢測 異常值是遠離其他觀察的觀察點。異常值可能是由於測量的可變性,或者可能表示是數據中的錯誤。特別是在大數據集的分析中,異常值檢測是一種常用的技術,用於檢測錯誤或虛假的數據點。 數據可視化 統計圖形,也稱為圖形技巧,這些圖形是使用在可視化定量數據統計的領域中 ( graphics in the field of statistics used to visualize quantitative data. )。數據可視化廣泛應用於大數據領域,因為它將大型數據集壓縮為易於理解且易於討論的摘要圖。特別是在企業環境中,使用數據可視化技術很重要,因為不是每個人都有統計和演算法背景。 最常見的數據可視化技巧包括: 條形圖 ( Bar charts ) 直方圖 ( Histograms ) 散點圖 ( Scatter plots ) 雙圖 ( Bi-plots ) 箱形圖 ( Box plots ) Q-Q圖 ( Q-Q plots ) 餅狀圖 ( Pie charts ) 雷達圖 ( Radar charts )
-
第六章 大數據流程
大數據專案的執行,可以為企業帶來價值,帶來了結構、可衡量的步驟、並且可以在日常的基礎上進行有效管理。此外,流程通過遵循類似的程序和步驟,將大數據專業知識嵌入組織中,將其作為組織的 “實踐” 嵌入。分析這件事情,變得越來越不依賴於個人,因此大大增加了長期獲取價值的機會。 大數據流程可以細分為三個主要子流程: 數據分析流程 - Data analysis process(控制); 數據治理流程 - Data governance process(合規); 數據管理流程 - Data management process(品質)。 數據分析流程 第1步 - 確定業務目標 ( DETERMINE THE BUSINESS OBJECTIVE ) 數據分析流程的第一步必須在有數據之前發生 - 需要確定大數據專案的目標和業務目標。因為這世界上的數據集之絕對數量是很龐大的,可能會很快失去焦點。因此,第一步對於確定專案的範圍至關重要。 在大數據專案中,業務目標(以及它的潛在問題)通常可以細分為六種類型的問題。每一種類型都有自己的方式來處理問題的結果和最終結果需要解釋的方式: 1) 描述型的業務目標 ( Descriptive business objective ) 2) 探索型的業務目標 ( Exploratory business objective ) 3) 推理型的業務目標 ( Inferential business objective ) 4) 預測型的業務目標 ( Predictive business objective ) 5) 因果型的業務目標 ( Causal business objective ) 6) 機理型的業務目標 ( Mechanistic business objective ) 第2步 - 數據識別 ( DATA IDENTIFICATION ) 數據分析過程的第二步是確定需要處理哪些數據集。通常,這是最重要和最困難的步驟之一。 如何確定分析問題所需的數據集並提供業務目標的答案?大多數數據分析從識別原始數據開始。原始數據是尚未處理的數據,直接來自源頭。 為了識別滿足業務目標的必要數據,可以繪製數據標識圖,其從處理的數據向原始(源)數據反向工作。 第3步 - 數據收集和來源 ( DATA COLLECTION AND SOURCING ) 在確定哪些數據是實現業務成果所需之後,下一步是確保獲得數據以進行處理。雖然這聽起來是一個相對簡單的步驟,但在實踐中它往往是一個不同的步驟。 第4步 - 數據審查 ( DATA REVIEW ) 在所需數據集可用之後,將啟動數據審查步驟。數據審查是探索數據集的過程,通常包括檢查各種數據集的結構和變量。在此過程中,確定數據集是否已經損壞,是否存在缺失值或是否存在多個(互相衝突)相同變量的集合。例如,可能是來自兩個不同財務系統的特定區域的銷售數據具有不同值的情況。 第5步 - 數據清理 ( DATA CLEANSING ) 數據清理是一個過程,它主要去修改或刪除資料庫中不正確、不完整、格式不正確或重複的數據。數據清理可以通過數據清理工具以互動交互式的方式執行,也可以通過腳本 ( Script ) 進行批量處理。清理後,數據集應與系統中的其他類似數據集保持一致,隨時可用於數據處理。 第6步 - 模型構建 ( MODEL BUILDING ) 數據分析過程的下一步是生成統計模型,該模型可用於將結果發現給業務目標。模型構建是定義和改進可應用於(清理的)數據集的統計模型的迭代過程。 可以將數學公式或稱為演算法的模型應用於數據以識別變量之間的關係,例如相關性或因果關係。一般而言,可以開發模型以基於數據中的其他變量來評估數據中的特定變量,其中一些殘餘誤差取決於模型精度(即,數據=模型+誤差, Data = Model + Error )。 第7步 - 數據處理 ( DATA PROCESSING ) 數據處理步驟專用於執行實際分析任務,其通常涉及運行一個或多個(統計)演算法。這個步驟可以是迭代的,特別是如果數據分析是探索性的,那麼重複分析直到發現適當的模式或相關性。 根據所需的過程類型,數據處理步驟可以很簡單,就像查詢數據集的平均值、眾數或中位數一樣簡單。另一方面,它可以像組合多個複雜演算法般的一樣複雜,比方說進行人臉識別、DNA排序或金融市場預測的演算法。數據處理階段的持續時間因要求而異。如第4章所述,大多數大數據解決方案將使用某種形式的分散式處理(最常見的是Hadoop軟體框架)來減少必要的處理時間。 第8步 - 傳達結果 ( COMMUNICATING THE RESULTS ) 大數據分析過程以傳達最終結果而告終。雖然這是任何分析專案,在邏輯上的最後一步,但其重要性不容低估。明確溝通對於合理的數據分析至關重要。 數據治理流程 數據治理流程是企業遵循的一個定義流程,以確保它們在整個生命週期中控制其數據。由於 “大數據” 是一項戰略資產,大多數組織需要建立控制措施。數據治理流程可確保在整個企業中正式管理重要數據資產,並且可以信任數據以進行決策。通常,數據治理中使用的流程包括對數據品質導致的任何不利事件的責任。 數據治理流程與數據管理流程之間存在密切關係,數據治理流程在戰略級別設置策略和職責的情況下,數據管理流程在操作級別上執行和監控這些策略。 數據管理流程 數據管理流程是一個單獨的流程,可以保證日常操作級別的數據品質,主要目標是確保數據品質。通過分析大數據可以獲得的價值,在很大程度上取決於輸入數據的品質。即使使用最複雜的大數據解決方案,一般的 “Garbage-In-Garbage-Out” 規則仍然適用。如果數據集損壞或錯誤,數據分析可能會導致無效結果或結論。 數據管理流程是一個實際和可操作的流程(符合數據治理流程的戰略指示),每天監控數據品質。 該流程包括以下活動: 指定指標和績效指標 ( SPECIFY METRICS AND PERFORMANCE INDICATORS ) 數據改進和驗證 ( DATA IMPROVEMENT AND VALIDATION ) 溝通和教育數據管理 ( COMMUNICATE AND EDUCATE ON DATA MANAGEMENT )
-
第七章 大數據職能
在企業中推動大數據專案,企圖成為數據導向企業時,就是一種數位轉型,大數據管理與大數據導向的組織至關重要。大數據組織的設計是需要由用戶主導,並從一開始就參與企業的各個層面。必須擁有一些真正瞭解大數據價值的擁護者,並且可以幫助開發場景和制定大數據戰略。 大數據卓越中心(BDCoE)是一項企業職能部門,它將組織從零知識轉變為擁有大數據技術和流程的全功能實踐,以提供強大的業務成果。大數據卓越中心是組織識別新技術、學習新技能並開發適當流程的地方,隨後部署在整個組織的其他業務部門。 大數據卓越中心由五個主要支柱組成,它們共同構成了從集中功能中獲取價值的結構。 大數據團隊 ( BIG DATA TEAMS ) 這是重要的因素:大數據分析師、大數據科學家和大數據工程師的品質,對於通過大數據創造成功至關重要。最後,大數據是知識領域,知識將來自人。大數據專業人員需要是具有數據處理的認證和經驗豐富的從業人員。 大數據實驗室 ( BIG DATA LABS ) 大數據實驗室提到大數據卓越中心的工作環境。數據 “科學” 與實驗室之間的明顯聯繫是有目的的,因為環境應該是一個創造性的空間來實驗和運行測試數據與數據分析,以達到預期的效果。 精心設計的大數據實驗室包含開放式工作空間,允許通信和協作以及孤立的工作可能性,數據分析師可以在不分心的情況下 “咀嚼數字”。大數據實驗室的第二個重要要求是讓其電腦硬體與大數據處理可以兼容。通常,大數據實驗室所要求的硬體,必須要具有比通常大得多的記憶體,才足夠進行數據處理。 大數據概念驗證 ( BIG DATA PROOF-OF-CONCEPTS ) 概念驗證(POC)是可以提供給內部業務部門和外部客戶的展示解決方案。POC應顯示出明確的投資回報,並清楚地展示大數據卓越中心在實現結果方面的能力。 敏捷方法論 ( AGILE METHODOLOGY ) 敏捷性以及快速失敗或實現快速結果的能力對於發揮大數據的潛力至關重要。 通常在兩到三周的衝刺中,敏捷工作方法提供了快速、透明地產生結果的工具。快速失敗的能力是一個關鍵的大數據機會 - 提供價值的商業和技術路線圖需要比傳統的瀑布式環境 ( waterfall environment ) 更頻繁地需要改變。( 瀑布式環境通常是指按部就班的一種環境,一步步地走下去,因為不會經常的回頭審查,所以被形容成像瀑布一般,水流下而不會回頭。 ) 收費模式 ( CHARGING MODELS ) 大數據卓越中心的核心是收費模式,以證明中心的人員、流程和技術(有時是大型)的投資報酬。為了顯示價值,需要設計一種明確的方法來向其他業務部門或外部客戶收取所提供服務的費用。可以基於數量或用戶、處理的數據、報告的頻率或基於訂閱來設計計費模型。 一個健全而明確的收費模式可以顯示出大數據卓越中心對企業的價值。 大數據團隊的角色和職責 大數據分析師 ( BIG DATA ANALYST ) 大數據分析師的職責是從大數據集中獲取、處理和匯總資訊,以發現業務價值。與數據科學家不同,大數據分析師更多的是通才,通常必須瞭解R、Python、HTML、SQL、C ++和JavaScript。他們需要更熟悉數據檢索和儲存系統、數據可視化和使用ETL工具的數據倉庫,基於Hadoop的分析和商業智能概念。通常在數學、統計學、機器學習和編程方面擁有強大的背景。 大數據分析師參與數據處理和數據可視化。如果有來自利益相關者的數據洞察請求,數據分析師必須查詢資料庫。他們負責處理數據,確保品質並進行管理。他們必須解釋數據並有效地傳達相關資訊。 大數據科學家 ( BIG DATA SCIENTIST ) 大數據科學家是一個涉及演算法和統計模型的開發和部署的角色,以預測基於大數據集提供商業價值的未來結果。近年來,數據科學家的角色越來越受歡迎,並且對這個工作角色有著巨大的需求。 大數據科學家的工作角色是一個高級角色,需要深入理解演算法和數據處理操作。具有此角色的人員有望成為R、SAS、Python、SQL、MatLab、Hive,Pig和Spark的專家。數據科學家通常在統計學和數學等量化科目中擁有較高學位,並且在大數據技術和分析工具方面具有很高的實力。 數據科學家的角色不僅僅是數據處理。他們可以理解業務挑戰,為數據創建一些有價值,並且可操作的見解,以及將他們的發現傳達給業務。此外,數據科學家的角色需要創造性思維和解決問題的技能,這些技能是設計、開發和部署可從大數據中檢索價值的演算法所必需的。 大數據工程師 ( BIG DATA ENGINEER ) 大數據工程師負責設計、構建和管理從大數據集中獲取價值所需的底層資訊基礎架構。數據工程師確保企業的大數據生態系統順利運行。大數據工程師是電腦工程師,他們必須瞭解Pig、Hadoop、MapReduce、Hive、MySQL、Cassandra、MongoDB、NoSQL、SQL、數據流和程式的編寫等。數據工程師必須熟練掌握R、Python、Ruby、C ++、Perl、Java、SAS、SPSS和Matlab。其他必備技能包括ETL工具、數據API、數據建模和數據倉庫解決方案的知識。 大數據工程師通常也被稱為 “大數據架構師”。由於兩個工作角色本質上非常相似(例如,管理大數據基礎架構),因此本手冊使用的術語是大數據工程師。 其他大數據角色 ( OTHER BIG DATA ROLES ) 由於大數據領域正在快速增長,因此存在更多大數據角色。例子包括機器學習工程師、MIS報告執行官 ( 負責產生各種報告 ),大數據解決方案專家等。這些角色中的大多數需要特定大數據平台或工具的專業知識。然而,操作任何大數據卓越中心最重要的角色可以通過上面討論的三個角色來概括。 大數據的組織成功因素 (1) 建立如何創造價值的願景:第一個里程碑是清楚地瞭解您的組織正在嘗試使用大數據實現的目標。如果沒有關於組織想要使用該數據完成什麼樣的行動計劃的清晰視圖,那麼您的組織每天捕獲數TB的數據的這一件事是毫無意義的。 (2) 要想成功實現大數據,從小處著手:構建大數據功能需要時間。對大數據團隊的一次性大額投資不會立即產生結果。因此,建議採取可控增長的小起點。首先,定義一些相對簡單的大數據專案,這些專案不會花費太多時間或數據來運行。例如,在線零售商可能首先確定每個客戶查看的產品,以便公司可以在他們不購買時發送後續報價 ( follow-up offer )。像這樣的一些直觀例子,允許組織查看數據可以執行的操作。更重要的是,這種方法產生的結果很容易測試,以查看大數據提供的返回類型。 (3) 從一開始就建立大數據流程:從一開始就明確誰負責什麼。設計有效的數據治理和數據管理流程,指定誰負責數據定義、創建、驗證、管理和驗證 - 業務、IT或大數據卓越中心。 4) 建立一個大數據卓越中心:集中的大數據卓越中心提供了一個統一點,其中結合了大數據實踐和技術的專業知識。大數據卓越中心可與業務部門合作,確定哪些專案應優先考慮、哪些數據具有戰略重要性。因此,它作為業務的戰略合作對手,將當前和實際業務需求轉換為可實施與可操作的大數據專案。 5) 評估您對大數據的準備情況:為了確定可能出現的潛在差距和風險,請進行大數據準備評估。這是對您的IT環境和內部技能的準備情況,所作的評估,以實施大數據專案的組織,並授權現有團隊的成員作為整個組織的公民數據科學家 ( citizen data scientists ),以便將大數據的強大功能用於驅動你的企業前進。
-
第八章 人工智慧
人工智慧是一種藝術,也是一個智慧的實體,可以依據環境的不同,而做出相對的反應。 談到人工智慧,不能不提到艾倫圖靈 ( Alan Turing ) 。 艾倫圖靈是一位電腦科學家,他開發了第一種關於人工智慧的理論,他所設計的圖靈測試,可以用來測試一台機器的智能程度,當一位人類詢問者被賦予任務,要來確認玩家A或B,那一個是電腦或那一個是人類?但詢問者無法確定其差異時,則稱該電腦具有智能。由於當時語音辨識技術並不成熟,詢問者提問時僅限於使用書面提問。 電腦如何通過圖靈測試?如果我們仔細研究一台機器應該具備哪些底層技術才能通過,那麼電腦至少需要以下功能: 自然語言處理 ( Natural language processing ) - 電腦需要能夠翻譯英語才能有效地進行交流。 知識表現 ( Knowledge representation ) - 電腦需要儲存輸入數據並在以後檢索相同的數據。 自動推理 ( Automated reasoning ) - 電腦需要能夠使用儲存的資訊來回答問題並得出結論。為了實現這一點,電腦需要應用演算法。 機器學習(Machine learning) - 電腦需要調整其對先前輸入數據的響應,以便制定新的響應。 大數據和人工智慧之間的主要差異點,在於大數據分析和解析大多停留在預測性和指導性解析 ( predictive and prescriptive analytics ) 中,人工智慧的目的則是多了認知科學技術。 認知分析 認知分析是基於感知環境和個性化特徵,設計和開發能夠反映出類似人類決策的演算法。認知分析不同於其他形式的分析,原因有兩個: 認知分析基於感知環境做出決策。在一天中的任何設定時間,環境都是不一樣的(從自動駕駛汽車的例子中可以清楚地看出)並且需要根據具體情況進行處理。為了檢測感知環境,需要通過感測器捕獲輸入數據。 認知分析基於個性化特徵做出決策。演算法從其特定用戶那裡學習,以便調整其對特定個人的決策。在學習恆溫器的例子中,兩個不同家庭的溫度將根據其個人用戶的特徵而具有不同的加熱模式。 為了實現人工智慧的這兩項關鍵特徵,認知分析關注於理性代理 ( rational agents ) 的發展。代理 ( an agent ) 通過一個或多個感測器感知來自特定環境(在自駕車中的交通或在Siri的情況下的語音)中的數據。代理隨後處理這些數據(使用某種演算法),然後採取特定的行動方案。該決定是自主的,類似於人類在類似情況下所做的決定。 深度學習 深度學習是一種機器學習,可以處理更廣泛的數據資源,需要更少的人類數據預處理,並且通常可以產生比傳統機器學習方法更為準確的結果(儘管它需要更多的數據來做)。由於深度學習的成功,造就人工智慧領域的重大進展 資料來源:NVIDIA 深度學習將原始數據分解為多個層(使用反向傳播演算法),然後將這些層相互比較。使用這種技術,將大數據集分解為可以分析的結構化資訊片段,變得更加有效。 深度學習主要應用於處理圖像、視頻、語音和音頻等等。
-
-
網路文章分享
跟大數據相關的文章以及閱讀心得分享
-
Enterprise Big Data Analyst Guide中文版搶先看
原文手冊下載: https://www.bigdataframework.org/resources/ Enterprise Big Data Analyst 的手冊翻譯,已經到了最後階段,交給第三方專業團隊進行審查當中,在APMG 正式發布這個認證考試的時間後,將會正式發佈中文版本。 這本手冊,內含有16套的案例與數據集。除了兩套案例與數據集沒有找到原廠的資料外,其餘14套,都已經找到,並且把相關的 source code 給驗證過了。另兩套,後來,也利用相類似的案例與數據集,也把相關的 source code 給驗證過了。 以下的五張圖是我們整理出來的核心重點。 第一章與第二章 第三章 第四章 第五章 第六章
-
大選背後的大數據
https://www.facebook.com/EBDCinTaiwan/posts/2825794897473438 by Enterprise Big Data Certification in Taiwan 終於結束了!選舉就儼然是一場「大型的」、「全民的」#數據分析課程。在選前,多少次的民調,然後呈現數據,分析數據。在選後,你看各家媒體,無不利用全力,盡快的統計數據,然後呈現數據 … 多少名嘴,根據數據,分析各家的選情。真的不要懷疑,這已經是一個數據化的社會,各行各業都脫離不了分析,或是被分析。具備相關的知識與能力,絕對是必要的。 免費說明會:http://www.learnmydata.com/seminar.html 課程說明:http://www.learnmydata.com/course.html #大數據國際認證#BigDataFramework 全台選情(天下雜誌) https://web.cw.com.tw/2020-taiwan-presidential-el…/data.html
-
2020 Enterprise Big Data Analyst 的進度報告
https://www.facebook.com/notes/enterprise-big-data-certification-in-taiwan/enterprise-big-data-analyst-%E7%9A%84%E9%80%B2%E5%BA%A6%E5%A0%B1%E5%91%8A/2791597054226556/ Enterprise Big Data Analyst 的進度報告 by Enterprise Big Data Certification in Taiwan 很多人都已經知道了!2019年的10月30日,英國 APMG 舉辦了 Enterprise Big Data Analyst 的網路發布會。然後在11月1日,在吉隆坡的大華酒店,也舉辦了正式發布會。時間很快,兩個月的時間就快過去了,有沒有什麼進度呢?2019 年也快過去了,我們在 2020 年可以有什麼期待呢? 首先,我要對某人抱歉!網路發布會的影片翻譯,我只做了三分之一。英文的聽力還是有點差!為了節省時間,就開始動手翻譯 Enterprise Big Data Analyst 的手冊。當然,翻譯也是一種深層次的閱讀與思考!這本手冊,繁體中文的翻譯草稿已經完成,並且已經執行了完整的一次的校閱工作。 在此,還是要提醒大家,原版的 Enterprise Big Data Analyst 手冊可以免費下載。如果您對於以下我們的論點有意見,也歡迎您自行下載閱讀後發表自己的想法。 我們思考一下我們的日常工作模式!一般正常的工作邏輯都是:先看到問題,或是想要解決、感興趣的問題,然後思考如何去做,然後嘗試利用某些工具與技術進行實踐,再來修正或是優化,經過了幾個輪迴,得到你要的,或是失敗後獲取經驗而已。這是很簡單的邏輯,不過很奇怪的!市面上書籍,或是課程,多半都是標榜某些技術,或是某些產品 … 學習之後,該如何應用?可能又是一個關鍵。 上述的邏輯,其實就是Enterprise Big Data Analyst 想要呈現的過程!原文說道:First, we identify the business problems and objectives, and we subsequently explain which techniques or algorithms can be used to solve these enterprise questions. ( 首先,我們確定業務問題和目標,然後我們解釋可以用來解決這些企業問題的技術或演算法。) 所以,當您在看這本書的時候,首先會看到目標是什麼,然後判定這些目標該如何去執行。此時,你才會需要思考該如何利用那些演算法,或是技術,或是工具等等。 所以,這本手冊內,就會有許多案例、數據集,還有相關的程式碼,可以讓各位實際的去體驗如何去實踐的解決業務問題。這也是我們現在還無法發布繁體中文版的原因。因為,我們已經在開始驗證這本手冊內的每一個案例、每一個數據集與每一個程式碼。這項工作,估計還要進行一個月的時間! 所以,有人或許會問:未來這項國際認證的課程與考試,就會非常的依賴案例、數據集與這些程式碼的內容,進行實際的體驗如何解決企業內的需求與問題嗎?答案似乎已經呼之欲出了!對不起,應該是的。為什麼不能肯定呢?因為英國 APMG 還沒有發布正式的課程大綱,所以我們不能給您肯定的答案。未來的這項國際認證考試,也將會圍繞著案例來進行!這是肯定的。因為,我個人已經受邀參加英國 APMG 的這項考試的審查工作。我個人已經考過一次 Enterprise Big Data Analyst 的考試,預期明年初,還會再參加一次考試。這兩次的考試經驗,將會提供報告給 APMG。 Enterprise Big Data Analyst 的考試是2.5 個小時,外加 40 分鐘。一共只有四題,每一題都有案例圍繞的題目,各有 20 個小題,不一定是單選題。可以參考手冊,但是你找不到答案的。之前的公布是 50% 及格,不過,據說要提到 65% 才及格。這個及格分數的更改,我個人已經羅列三大理由給 APMG 了,希望他們能維持原案,不要調整。 從上面的文字看來,您將會發現 Enterprise Big Data Analyst 國際認證課程,將會是一門非常實用的課程。從目標的解析、案例、數據集、演算法與工具,然後談精度,最後是數據呈現等。將會名符其實的成為 #大數據分析師 #國際認證。至於課程與考試,何時會在台灣上市?目前看來 2020 年的第二季度,應該是可以期待的。所以,在此之前,我想要提醒你的是:第一階段的Enterprise Big Data Professional #大數據國際認證 2020 年的課程計畫,不要忘記。因為必須要先通過這一個初級的認證,才可以往前進步。 再一次的提醒您!如果有興趣,就請考慮行動。行動才會產生機會,坐等是不會有奇蹟發生的。鼓勵您,數據分析、資料科學,不僅僅是人工智慧的機會,更是未來每項工作的必備能力。自己努力投資自己,絕對不會有錯。期待在教室見到你!
-
Enterprise Big Data Analyst 的進度報告
Enterprise Big Data Analyst 的進度報告 1.新版的 Enterprise Big Data Analyst 手冊可以免費下載。 2.Enterprise Big Data Analyst 國際認證課程,將會是一門非常實用的課程。從目標的解析、案例、數據集、演算法與工具,然後談精度,最後是數據呈現等。 3.Enterprise Big Data Analyst 的考試是2.5 個小時,外加 40 分鐘。一共只有四題,每一題都有案例圍繞的題目,各有 20 個小題,不一定是單選題。 原文出處: https://www.facebook.com/notes/enterprise-big-data-certification-in-taiwan/enterprise-big-data-analyst-%E7%9A%84%E9%80%B2%E5%BA%A6%E5%A0%B1%E5%91%8A/2791597054226556/
-
隨便聊聊 - 為什麼要學 Big Data Framework
其實,沒那麼嚴重!學習之後,就有機會去實踐,然後獲取相關的效益。如果不學,當然,什麼事情也不會發生的!現在這個社會,最大的不變,就是變 ... 穩定固然是好,可是如果穩定的下場是溫水煮青蛙 ( 想想日前 Oracle 中國研發中心的案例 ) ,那是責怪政府勞工保護不周,還是什麼呢 ?也難怪張忠謀先生最近強調終身學習的重要。以下的一些文字,就是最近看到與聽到的,算是給大家分享一下。 壹、如何驗證你是一位夠資格的數據科學家?數據分析師?或是數據的專業工程師? https://www.gvm.com.tw/article.html?id=49938&fbclid=IwAR2C5UtWGishymm33-_6-slhNiysYZ2lpjQNzOQRivJRrG0RwebEWNofPXw 企業最誘人的新職缺 資料科學家!文 / 戴文波特(Thomas H. Davenport)、帕蒂爾(D. J. Patil) 譯者/羅耀宗 2012-11-01 Enterprise Big Data Certification 是目前全世界唯一針對數據分析師、數據科學家與數據工程師認證的國際證照。利用這個證照來獲取未來可能的機會! 貳、 新的AI科技會把什麼東西變得如此平價?那就是預測。 《#AI經濟的策略思維:善用人工智慧的預測威力,做出最佳商業決策》 預測是將缺失的資訊填補起來的過程。預測是藉由擁有的資訊,通常稱為「數據」,用來產生你沒有擁有的資訊。預測即將改變世界。說的是很正確,但是該如何落實呢?思考一下,必須要利用一套方法,將大數據的價值給發掘出來,Big Data Framework 就是一套完整的方法,可以使團隊落實數據的價值發覺。 https://www.ithome.com.tw/article/127583?fbclid=IwAR1lquZXPzu51ifn8EJWu4Zi71cpdk6raNtY2rYZa6TVY2HDcDrrgjVNWJE 叁、 數位轉型的協作文化如何建構?沒有方法是不可能成功的。 【2019年產業趨勢觀察:IDC】企業要重塑數位轉型作法,AI、雲端和微服務最關鍵。臺灣企業數位轉型的腳程,落後於許多鄰近國家,IDC強調企業要正視協作文化、創新人才和IT應用的溝通,才可推進轉型的成熟度。 https://www.ithome.com.tw/news/127920?fbclid=IwAR1RPLpj5VfgDHy7iiJUQvINA6aSpcX7emN2josh3UW04Kp-jurVj5E5n_I 大數據是數位轉型的基礎,利用 Big Data Framework 來建構企業大數據協作的方法是目前全球唯一的方法。 肆、 歷史學家的建議 《#21世紀的21堂課》書中預測 21 世紀「數據將取代土地和機器,成為區分富人和其他人的最重要資產」。這是趨勢,關鍵是您該如何面對?「擁有數據的人,就擁有未來」 - 關鍵是只有擁有還不夠?你要如何應用你的數據?關鍵不是在個人!數據分析的能力,應該是「團隊」的能力,也就是說:無論企業中人來人往,企業自身的數據分析能力不會因為人的變化而產生變化。請參考 Big Data Framework。 伍、陳昇瑋先生的人工智慧發展四要素 陳昇瑋先生在《#人工智慧在台灣 》書內提到,人工智慧發展要素有四:人才、資料、演算法與運算能力。 提到「人才」- 就必須要想到每個人的職能與業務流程,其中卓越中心與敏捷的概念都很重要。 提到「資料」- 就必須要想到策略與流程,如何找資料、從那裡找、方向是什麼、為什麼這麼做等等。資料處理必然有一個流程!更何況還有資料治理與管理。 提到「演算法」- 演算法必然是核心!這沒有話可以說。 提到「運算能力」- 必定要想到架構。沒有架構方法,所有的資訊技術與設備,可能是疊床架屋,失去方向與價值。 說到以上這些,其實正好就是構成 Big Data Framework 的主要構成核心 – 策略、流程、職能、演算法與架構。Enterprise Big Data Professional 是第一階段的認證培訓課程,你還在等什麼呢?更重要的是:他的手冊可以免費下載,繁體中文版也幫你翻譯好了,可以免費索取。 陸、人才很重要,人才勢必是一個團隊 陳昇瑋先生在《#人工智慧在台灣 》書內提到人才很重要,也說到台灣缺乏人才。張忠謀先生也提到數據人才不會失業,以及終身學習的重要。這兩件事情搭配在一起,你想到了什麼? 這是世界變化很快,一份固定工作做到老死,看似安穩,可是卻可能無法安穩。老外一在強調:share knowledge,為什麼不打起精神來終身學習呢?變成所謂的人才呢? 從企業的眼光來看,人才絕對不是一個人,勢必是一個團隊。關鍵是:如何讓這一個團隊的人才發揮最大的效益?這絕對不是大家都很厲害就可以結束的!把這一些很厲害的人,變成一個很厲害的團隊,然後產生很高的團隊能力,創出很高的價值,才應該是最終的目標。所以,人才只是起點!你如果連起點都放棄,那真的就不好說什麼了!Big Data Framework 是可以讓團隊數據分析能力提升的方法,關鍵是你不知道這個方法該如何去應用?那就讀書吧。之後,可以上課,並且考取認證,告訴別人你是這一個方法的專家。 Big Data Framework 有六大核心能力,需要你去研究與實踐。 四個階層的認證系統
-
人才是多數,不應該是單數
文章出處: Enterprise Big Data Certification in Taiwan Big Data Framework 出現在這個地球上大概有一年多了,計劃的四個課程與認證,一直停留在第一個課程與認證:Enterprise Big Data Professional。日前,我聯繫了 Big Data Framework 的首席考官,問他第二個 Enterprise Big Data Analyst 何時會發布?他告訴我:快了,英國APMG 已經在進行最後的檢查了,他建議我們可以開始準備翻譯了。 為什麼會拖那麼久?答案其實你我都可以猜得出來!對的,就是為了「品質」。不過,首席考官說:這流程也超過預期了!他是荷蘭人,他似乎也有點小小的埋怨。 英國 APMG 為了提供高品質的課程與考試,流程複雜,耗費時間,甚至有點不顧市場的需求,堅持要完整的流程與審核。去年底,我們申請在台灣教授這一堂課的時候,經歷了這個流程的繁瑣與嚴謹,非常的令人難受!但是,這就是希望提供給大家一個高品質的學習結果,不是嗎?這一點,似乎不像是台灣某些教育訓練中心,就是依賴的所謂名師的招牌,事實上,名師的講授,真的是你能接受的嗎?我沒有答案。 其實,從這裡來看,你就會發現一點事實!西方人做事情多半是依賴組織作為與團隊能力,這似乎不像是東方人的習慣。#陳昇瑋 先生的書 #人工智慧在台灣 說道人才很重要!企業都在找人才,但是似乎沒有強調人才不會是一個人,人才必定是一個團隊!如何組織?如何分工?這其中搭配的目標與流程等都應該是關鍵。我們與西方人的差距,似乎就在這裡。 數據分析的能力也是,這不僅是個人的能力,更應該是團隊的能力。企業不應該依賴少數的專家,所要思考的是:如何將能力深植於自己的組織當中;即便是人來人往,組織的能力依舊是可以精進的。這一點觀念,請參考由歐洲主導制定的 Big Data Framework。 原廠手冊的免費下載登記。中文版翻譯的免費登記。
-
啤酒與尿布是傳奇典範,還是純粹的以訛傳訛?
凡是接觸過BI(商業智慧)或是大數據分析,大概都聽過啤酒與尿布的故事,而且在分享案例時,大多數人也會提到這個案例. 當我們做了一連串的大數據分析之後,我們看到啤酒與尿布的採購行為關聯,建議商場要把啤酒與尿布放在附近的位置,當消費者買尿布時,可以方便採購啤酒,又或者是讓消費容易看到啤酒,刺激採購慾望增加銷量. 商場有因此而將尿布與啤酒放在隔壁區域嗎?不只是在這個案例上的商場沒有,我們常去的商場似乎也沒有這樣做,甚至也沒看過尿布與啤酒相關的促銷活動. 這是一個很有趣的發現, 大數據分析出了什麼問題? 大數據分析找出的關聯性是正確的,只能說在商業決策上,還有更多數據之外的"商業智慧"有待我們去探索. 原文出處: https://medium.com/@baubibi/啤酒與尿布是傳奇典範-還是純粹的以訛傳訛-e682a7dee7a
-
-
課程資訊
-
2020年3月台北開課計畫
Enterprise Big Data Professional 三月台北開課計畫 - 報名表 上課日期與時間:3/21 ~ 3/22(週六與週日),每天 09:00 ~ 17:00 考試日期與時間:3/28 ( 週六 ),上午 課程的地點是在台北:翰竺學院 - IBM 課程中心。 報名截止日期是:3/13。當我們確認開課之後,會請您匯款,收到您的匯款之後,將要幫您向英國 APMG 註冊,這期間需要時間處理,請把握時間。 這次課程的收費是每人NT$31,500 ( 原價 NT$35,000 ,已經是九折優惠,包含課程費用與考試費用,不含稅 ,全世界最低價格)。如果在 3/6 ( 含 ) 以前報名交款,將提供早鳥優惠,每人 NT$29,750 ( 不含稅,八五折優惠,包含課程費用與考試費用 ) https://www.bigdataframework.org/certifications/enterprise-big-data-professional/ 在您上課之前,務必要先下載這裡的四份文件,請仔細閱讀。尤其是 Enterprise Big Data Professional Guide 與模擬試題,它是考試的主要內容。同時,您也可以參考我們的 FB,https://www.facebook.com/EBDCinTaiwan/ 尋求繁體中文版的下載。
-
2020年1,2月台北開課計畫
Enterprise Big Data ㄋProfessional 一月台北開課計畫 2020 年 1 月 Enterprise Big Data Professional 台北公開課程報名表。 請注意:這是晚上上課。上課時間是星期二到星期五,共四天晚上的 18:30 ~ 21:30。 上課日期與時間:1/7 ~ 1/10 (週二與週伍),每天晚上 18:30 ~ 21:30 考試日期與時間:1/15 ( 週三 ),晚上 18:30 ~ 21:00。 課程的地點是在台北:翰竺學院 - IBM 課程中心。 https://docs.google.com/forms/d/e/1FAIpQLSePSBD9uKm-cgs4CINqTG3bGjIzOiDU6ry4Hw75vzTBshw-ew/viewform Enterprise Big Data Professional 二月台北開課計畫 2020 年 2 月 Enterprise Big Data Professional 台北公開課程報名表。 上課日期與時間:2/14 ~ 2/15(週五與週六),每天 09:00 ~ 17:00 考試日期與時間:2/22 ( 週六 ),09:30 ~ 12:00 課程的地點是在台北:翰竺學院 - IBM 課程中心。
-
2019年11,12月開課計畫
台北十一月的開課日期 ( 首次嘗試夜間開課 ) 上課日期與時間:11/26 ~ 11/29 (週二與週五),每天晚上 18:30 ~ 21:30 考試日期與時間:12/6 ( 週五 ),晚上 18:30 ~ 21:00 http://www.learnmydata.com/course.html 台北十二月的開課日期 上課日期與時間:12/7 ~ 12/8 (週六與週日),每天晚上 09:00 ~ 17:00 考試日期與時間:12/14 ( 週六 ),上午 09:30 ~ 12:00 http://www.learnmydata.com/course.html
-
2019年11月擴大說明會
時間 : 2019年11月9日 星期六,下午2:00 – 下午4:00 地點: 財團法人台北基督教女青年會 YWCA 902 教室 ( 電梯直上九樓 ) / 台北市中正區青島西路7號 這場說明會中,將會有一些特點: 1. 原廠關鍵人士的錄影說明 - Big Data Framework 的創始人、APMG 首席考官 - Mr. Jan-Willem Middelburg 以及英國 APMG 大中國區總經理于海霞女士。 2. 如何驗證自己的數據能力?如何建立團隊的數據能力?為什麼數據能力不再是傳統的技能?而是綜合能力的構成。我們將會有一個完整的說明。 3. 前輩們的心得分享 4. Enterprise Big Data Analyst 的發布與未來的計畫 活動票卷: https://ebdcintaiwan.kktix.cc/events/104d82ba-copy-1?fbclid=IwAR0JnsgGoRuoTaydLQAG15SxqYtINlhroFR5VIq0CtpGnYNWc-dxwswYy9s
-
2019年10月最新訊息-Enterprise Big Data Analyst即將發佈
Enterprise Big Data Certification in Taiwan 千呼萬喚!我們已經有明確的官方通知:Enterprise Big Data Analyst 即將會有發布的資訊。我們將會在 10/2 晚上的說明會向大家報告。 Enterprise Big Data Analyst 是 Enterprise Big Data Professional 的進階認證。如果你還沒有獲取 Enterprise Big Data Professional 的認證,十月份的課程就趕快來。 原廠網站: https://www.bigdataframework.org/announcement-upcoming-enterprise-big-data-week/
-
2019年10月台灣開課訊息
十月份說明會 時間:2019-10-02(三) 19:00 ~ 20:00 (GMT+8) 地點:翰竺學院 - IBM 課程中心 /台北市松山區台北市松山區復興北路99號14樓 主辦單位:Enterprise Big Data Certification in Taiwan https://www.accupass.com/event/1909160243585898513090 十月份課程: 台北 課程日期:2019 年 10 月 19 日 ~ 10 月 20 日(星期六與星期日) 考試日期:2019 年 10 月 26 日 ( 星期六 ) 上午 地點:翰竺學院 - IBM 課程中心 (台北市松山區復興北路 99 號 14 樓) https://docs.google.com/forms/d/e/1FAIpQLSfmYmyElFpEKHOuz64jNFanI3nNpoYuaSPYMornP54jkVjF7A/viewform 台中 課程日期:2019 年 10 月 5 日 ~ 10 月 6 日 ( 星期六與星期日 ) 考試日期:2019 年 10 月 12 日 ( 星期六 ) 上午 https://docs.google.com/forms/d/e/1FAIpQLSdAW2VyMjDp5xDgAujBxRiRQzJQaGEN0XZlMFFP3R14UYzVQA/viewform
-
2019年9月台灣開課計畫
九月份說明會 時間:2019年9月4日 星期三下午7:00 – 下午8:00 地點:翰竺學院 - IBM 課程中心 /台北市松山區台北市松山區復興北路99號14樓 主辦單位:Enterprise Big Data Certification in Taiwan https://www.facebook.com/events/400305130623505/ 九月份課程: 台北 課程日期:2019 年 9 月 21 日 ~ 9 月 22 日(星期六與星期日) 考試日期:2019 年 9 月 28 日 ( 星期六 ) 上午 地點:翰竺學院 - IBM 課程中心 (台北市松山區復興北路 99 號 14 樓) 台中 課程日期:2019 年 10 月 5 日 ~ 10 月 6 日 ( 星期六與星期日 ) 考試日期:2019 年 10 月 12 日 ( 星期六 ) 上午 http://www.learnmydata.com/201909.pdf
-
2019 年 8 月台灣開課計畫
課程說明會: 課程日期:2019年7月31日 星期三下午7:00 – 下午8:00 地點:翰竺學院 - IBM 課程中心 (台北市松山區復興北路 99 號 14 樓) https://ebdcintaiwan.kktix.cc/events/ebdc190528-copy-2?fbclid=IwAR2FeZHPj18YDqQsEKuJzKFqU5R1GXK04KqI8B9j-tYpJJd_Pp0OA6go_qY 正式課程: http://www.learnmydata.com/201908.pdf 地點 台北 – 點擊報名 課程日期:2019 年 8 月 19 日 ~ 8 月 20 日 ( 星期一與星期二 ) 考試日期:2019 年 8 月 24 日 ( 星期六 ) 上午 地點:翰竺學院 - IBM 課程中心 (台北市松山區復興北路 99 號 14 樓) 台南 – 點擊報名 課程日期:2019 年 8 月 17 日 ~ 8 月 18 日 ( 星期六與星期日 ) 考試日期:2019 年 8 月 25 日 ( 星期日 ) 下午 地點:地點待定
-
2019年7月份公開說明會影片分享
時間 : 2019年7月3日 星期三下午7:00 – 下午8:00 地點 : 翰竺學院 - IBM 課程中心 / 台北市松山區台北市松山區復興北路99號14樓 演講影片內容: https://www.facebook.com/EBDCinTaiwan/videos/2052779284828412/ Big Data Framework是一個很新的框架,未來也是很有潛力的!它著重在將「數據的能力轉化在組織內」,因此希望給企業與個人帶來價值。 數據的重要性,其實大家都很清楚。關鍵是如何實踐!數據分析的能力,絕對不適狹隘的資訊技術能力而已,它牽涉的範圍十分的廣泛。這點,陳昇瑋先生的新書《人工智慧在台灣》就已經闡述的很清楚了。因此,將數據分析的能力化為團隊的能力,這絕對是必要的,未來,企業在拚搏能力之時,所依賴的絕對不是少數的專家,而是一個自身形成的能力。這項能力的構成,其實就是 Big Data Framework 的目標,然後再利用 Big Data Framework 的知識內涵,設計了四種認證:Enterprise Big Data Professional、Enterprise Big Data Analyst、Enterprise Big Data Scientist 與Enterprise Big Data Engineer。目前 Enterprise Big Data Professional 已經發布,Enterprise Big Data Analyst 也將要發布了。
-
2019年7月說明會與課程資訊
Enterprise Big Data Professional 七月份公開說明會: https://www.facebook.com/events/461163501363008/ 時間 : 2019年7月3日 星期三下午7:00 – 下午8:00 地點 : 翰竺學院 - IBM 課程中心 / 台北市松山區台北市松山區復興北路99號14樓 **國際認證課程** Enterprise Big Data Professional - 2019年7月台北開課計畫 https://learning.ithome.com.tw/course/LbrZUoWxDBlH649 時間 : 2019/07/20 09:00 ~ 2019/07/21 18:00 地點 : 翰竺學院 - IBM 課程中心 (台北市松山區復興北路99號14樓) 2019 年 7 月,台北公開班開課計畫,請先參考 影片 與 短文 - 為什麼我要考這一個認證。 本次課程,將會提供原廠 英國 APMG 標準的英文教材與認證考試的機會。 張忠謀先生提過,數據能力的人才是不會失業,關鍵還是要有不斷自我學習的精神。陳昇瑋先生也提過,台灣人工智慧缺少人才。你是不是人才?人才的關鍵是行動。這一門課程是你行動的開始。 這是國際上第一個「大數據綜合能力」的個人認證課程,引入台灣開課! 為什麼說是「大數據綜合能力」呢?大家都知道:一位專業的資料科學家,或是專業的數據分析師,絕對不是只有依靠資訊技術的能力就可以了!他們需要有數學統計的能力、溝通與數據展現的能力與領域與業務的能力。市場上,多數的大數據培訓都強調資訊技術,這不是錯,只是比較狹隘了。「擁有數據,就是擁有未來」- 關鍵是該如何分析數據,將數據的價值展現出來?這項工作,不是僅僅只靠技術,而是需要把各種技術、相關的資源,利用方法結合起來,朝向目標價值的方向前進。這個方法就是 Big Data Framework,這個方法是英國、德國、荷蘭與澳大利亞等國的專家所研發出來的,他們是獨立的團隊,與各電腦廠商都不具備任何的關係。 課程的內容為: Big Data Concepts and Key Drivers - 大數據概念和關鍵驅動因素 The Big Data Framework – 大數據框架 Big Data Strategy – 大數據的策略 Big Data Architecture – 大數據的架構 Big Data Algorithms – 大數據的演算法 Big Data Processes – 大數據的流程 Big Data Functions – 大數據的職能 Artificial Intelligence – 人工智慧 請參考我們的 FB 粉絲頁 課程詳細介紹 時至今日,已經有大量文字報導描述過數據 ( Data ) 在企業中的快速增長,而且利用大數據分析可以獲得相應的價值。這些案例,似乎在身邊,比比皆是。 可是,該如何獲得到這些好處?如何快速擴展市場、更好的成本控制以及加强個性化的營銷方式等。這些議題依舊是許多企業面臨到的挑戰。 雖然許多企業都感受到了大數據的價值,其中很多企業甚至都已經開始進行大數據分析等方面的努力,可是還有許多企業仍難以在大數據專案上實現正向的投資回報。 這是為什麼? 「大數據」絕對不是一個可以僅僅由資訊技術進行管理的專案或是部門。為了從大數據中獲得長期的價值,所需要做的工作,絕對不是招聘數據科學家和建置大數據資訊系統那麽簡單。而且,數據驅動的思維和數據驅動的决策都應該成為組織基因的一部分。說起來容易,做起來難。從某種意義上來說,向數據驅動企業的轉變完全可以看作是一個組織變革的計劃,它需要一種不同的思維方式,令組織內每一位成員,從戰略到文化,都去扮演重要的角色。因此,我們需要一套完整的方法,大數據框架(Big Data Framework)應運而生。 課程大綱 Big Data Concepts and Key Drivers - 大數據概念和關鍵驅動因素 The Big Data Framework – 大數據框架 Big Data Strategy – 大數據的策略 Big Data Architecture – 大數據的架構 Big Data Algorithms – 大數據的演算法 Big Data Processes – 大數據的流程 Big Data Functions – 大數據的職能 Artificial Intelligence – 人工智慧 課程難度 初階 課程適合對象 企業經理人、數據分析師、業務分析師、 數位行銷人員、IT顧問 、IT專業人員、 其他對於數據分析有興趣的人士 課程時數 16 小時 上課注意事項 相關的書籍,可以 免費下載,中文翻譯版 請到這裡 註冊免費索取。建議在上課之前,先自行閱讀。下載的內容有:guide、模擬試題與解答,課程大綱。 上課時間為一天半,另外半天將會進行模擬考試與講解,之後就進行正式的國際認證考試。 七月份的上課時間是:7/20 & 7/21 ( Sat & Sun ) 七月份的考試時間是:7/27 ( Sat ) 上午 同時報名上課與考試,還會享有額外優惠,請上報名網站參考
-
2019年6月台北開課計畫
報名網址: https://learning.ithome.com.tw/course/g5gcvifogeQO7Jr 2019 年 6 月,台北公開班開課計畫,請先參考影片 為什麼我要考這一個認證 本次課程,將會提供英國 APMG 原廠標準的英文教材與認證考試的機會。 國際上第一個大數據綜合能力的個人認證課程,引入台灣開課! 「擁有數據,就是擁有未來」- 關鍵是該如何分析數據,將數據的價值展現出來?這項工作,不是僅僅只靠技術,而是需要把各種技術、相關的資源等,利用方法結合起來,朝向目標價值的方向前進。這個方法就是 Big Data Framework,這個方法是英國、德國、荷蘭與奧大利亞等國的專家所研發出來的,他們是獨立的團隊,與各電腦廠商都不具備任何的關係。 課程的內容為: Big Data Concepts and Key Drivers - 大數據概念和關鍵驅動因素 The Big Data Framework – 大數據框架 Big Data Strategy – 大數據的策略 Big Data Architecture – 大數據的架構 Big Data Algorithms – 大數據的演算法 Big Data Processes – 大數據的流程 Big Data Functions – 大數據的職能 Artificial Intelligence – 人工智慧 請參考我們的 FB 粉絲頁 課程詳細介紹 時至今日,已經有大量文字報導描述過數據 ( Data ) 在企業中的快速增長,而且利用大數據分析可以獲得相應的價值。這些案例,似乎在身邊,比比皆是。 可是,該如何獲得到這些好處?如何快速擴展市場、更好的成本控制以及加强個性化的營銷方式等。這些議題依舊是許多企業面臨到的挑戰。 雖然許多企業都感受到了大數據的價值,其中很多企業甚至都已經開始進行大數據分析等方面的努力,可是還有許多企業仍難以在大數據專案上實現正向的投資回報。 這是為什麼? 「大數據」絕對不是一個可以僅僅由資訊技術進行管理的專案或是部門。為了從大數據中獲得長期的價值,所需要做的工作,絕對不是招聘數據科學家和建置大數據資訊系統那麽簡單。而且,數據驅動的思維和數據驅動的决策都應該成為組織基因的一部分。說起來容易,做起來難。從某種意義上來說,向數據驅動企業的轉變完全可以看作是一個組織變革的計劃,它需要一種不同的思維方式,令組織內每一位成員,從戰略到文化,都去扮演重要的角色。因此,我們需要一套完整的方法,大數據框架(Big Data Framework)應運而生。 課程大綱 Big Data Concepts and Key Drivers - 大數據概念和關鍵驅動因素 The Big Data Framework – 大數據框架 Big Data Strategy – 大數據的策略 Big Data Architecture – 大數據的架構 Big Data Algorithms – 大數據的演算法 Big Data Processes – 大數據的流程 Big Data Functions – 大數據的職能 Artificial Intelligence – 人工智慧 課程難度 初階 課程適合對象 企業經理人、數據分析師、業務分析師、 IT顧問 、IT專業人員、 其他對於數據分析有興趣的人士 課程時數 16 小時 上課注意事項 相關的書籍,可以 免費下載,中文翻譯版 請到這裡 註冊免費索取。建議在上課之前,先自行閱讀。下載的內容有:guide、模擬試題與解答,課程大綱。 上課時間為一天半,另外半天將會進行模擬考試與講解,之後就進行正式的國際認證考試。 六月份的上課時間是:6/22 & 6/23 ( Sat & Sun ) 六月份的考試時間是:6/29 ( Sat ) 下午 同時報名上課與考試,還會享有額外優惠,請上報名網站參考。 方案名稱 售價 報名期間 課程價格 ( 不含稅,不含考試費用 ) 20000 元 2019/05/14 00:00~2019/06/12 12:00 認證考試費用 ( 不含稅 ) 10000 元 2019/05/14 00:00~2019/06/12 12:00 售價 報名期間 課程價格 ( 不含稅,不含考試費用 ) 20000 元 2019/05/14 00:00~2019/06/12 12:00 認證考試費用 ( 不含稅 ) 10000 元 2019/05/14 00:00~2019/06/12 12:00 本課程由 chiehwu 發佈
-
2019年5月份 台南酷學員分享 - YouTube
活動議題: 大數據的實踐,除了技術,還需要什麼? 講師: 吳傑 簡介: 數據的重要性,其實在這裡可以不必說太多!數據是人工智慧的基礎,資料科學更是現在企業的顯學 - 大家都想從數據中發現相關的價值。擁有數據不是問題,關鍵是如何從數據中發現自身的價值。 應用於資料科學的資訊技術是何其得多!要能寫程式,可能也要懂資料...
-