Oreilly python 資料科學學習手冊
本課程是Cupoy Oreilly Python資料科學讀書會的影音講解內容,我們透過12堂程式碼講解課程的範例程式,完整帶你了解該書的主要範例程式碼,搭配本課程的詳細講解,你將能將該書的各種範例程式
內容簡介
作者介紹
適合人群
你將會學到什麼
購買須知
-
第一堂-了解Python的資料型態、Numpy陣列基礎
本堂課將介紹 Google Colab 的使用方式、 優勢,以及 Python 基本型態的語法與 Numpy 基礎語法的使用。
-
第二堂-在Numpy陣列中計算、聚合操作、Broadcasting、比較、遮罩以及布林邏輯
本堂課將介紹使用 Numpy 進行數值運算,以及不同 Numpy 物件下如何進行互動。
-
第三堂-花式索引、排序陣列、介紹Pandas套件、資料索引和選擇
本堂課將介紹 Numpy 如何使用索引技巧、如何使用排序技巧處理資料,以及介紹 Pandas 基礎語法與索引方式。
-
第四堂-在Pandas中操作資料、處理遺漏值、階層式索引
本堂課將著重在使用 Pandas 進行資料前處理,包含使用階層式索引挑選出正確的資料、處理遺失值使資料變得比較好等。
-
第五堂-資料集的合併、聚合計算與分組
本堂課將介紹兩個以上的 Pandas 物件如何進行互動,包含資料表的合併與分組等。
-
第六堂-樞紐分析表、向量化字串操作、使用時間序列資料、高效率Pandas
本堂課將介紹 Pandas 進階功能,包含能夠計算出統計量的樞紐分析表、處理表格內字串的向量化字串操作、處理時間相關資料等。
-
第七章-簡單的線條圖形、散佈圖、視覺化誤差、密度圖、等高線圖、直方圖、分箱法及密度、自訂圖例及色彩條
本堂課將使用 Matplotlib 套件繪製基本統計圖型,包含折線圖、長條圖、散佈圖、直方圖與分箱圖等,並講授如何改變圖的色彩,以及自訂圖例。
-
第八堂-多重子圖表、文字和註解、自訂刻度、客製化Matplotlib、Basemap的地理資料
本堂課將延續第七堂課的內容,分享繪製圖表時如何讓圖表更精緻的小撇步,包含同時建立許多子圖表、自訂刻度 。
-
第九堂-什麼是機器學習、介紹 Scikit-learn、超參數與模型驗證、特徵工程
本堂課將帶您初步進入機器學習的世界,簡介機器學習基本觀念、不同學習方法的比較,接著會介紹 Scikit-Learn 在機器學習實作上扮演的角色。
-
第十堂-線性迴歸、監督式學習
本堂課會包含以下三種簡單的機器學習模型: 1. Naive Bayes:樸素貝葉式 2. Linear Regression:線性迴歸 3. Support Vector Machine (SVM):支持向量機
-
第十一堂-決策樹和隨機森林、主成分分析、K平均集群法
本章節主題包含以下三者: 1. 機器學習中樹狀演算法,包含決策樹與隨機森林 2. 特徵樹過多時常使用的 PCA 3. 機器學習分群演算法中很常見的 KMeans
-
第十二堂-高斯混合模型、核密度估計、臉部辨識
本堂課將介紹機器學習進階方法與應用,包含 Gaussian Mixture Model、Kernel Density Estimation 與以臉部辨識做實戰應用。