東京大學資料科學家養成全書:使用Python動手學習資料分析
商品描述
作者:塚本邦尊、山田典一、大澤文孝 出版社:臉譜文化 出版日:1090613 ISBN:9789862358320 語言:中文繁體 裝訂方式:平裝 內容簡介 「大數據會消失,資料科學不會」 「所有的科學都是資料科學」 ―――資訊科學時代最需要閱讀的一本書――― 東京大學資料科學人氣講座全收錄──── ★傳說中的東大松尾研究室超熱門課程,第一手內容完整公開! ★用Python學習基本的程式撰寫,邊做邊學,鍛鍊最強的資料科學技能! ★收錄大量練習題和綜合題演練,打好理論基本功,具體應用於實務現場! ★體驗資料科學的魅力,培養整合跨領域課題的創造力! 所謂科學,是從世界上混沌的現象裡找出本質,逐步解決各式各樣的問題。在日漸龐大的各種資料當中,運用科學的力量解決各種問題,便可說是資料科學。 資料科學不僅只是數學(統計、機率、機器學習等),更是借用IT等各種力量,不斷挑戰世界上的難題與背後課題的綜合領域。 運用這樣資料科學和人工智慧的力量,減少浪費與沒有效率的事物,進一步創造出新價值,可以讓這個世界更加美好。 █ 動手操作實際的資料,大量練習題馬上學、馬上練、馬上懂! 本書廣泛說明資料科學不可不知的基礎事項,蒐羅豐富的重要關鍵知識和好用的參考資料,成為學習資料科學的地圖與羅盤。 書中主要使用Python來學習基本的程式撰寫技巧,以及資料的取得、讀取、操作等,含括各式各樣Python函式庫的使用方式、機率統計的手法、機器學習(監督式學習、非監督式學習、性能調校),還有讓Python高速化的方法和Spark的簡單操作等。 書中說明如何實際將現場的資料進行加工與分析,如何具體運用於市場行銷或金融等,使用何種手法來撰寫程式比較好,以及組合程式的技巧和流程。除了理論解說,也介紹實務性的使用方法,可立即上手應用。 收錄各種類型的實作練習題和綜合問題,以實際的問題為前提來思考,一邊動手實踐。 █ 本書的出版緣由 本書以2017年至2018年於東京大學舉辦的「全球消費智慧捐贈講座」講義和線上課程教材為基礎,用簡潔易懂的形式彙整編纂而成。 這個廣受歡迎的熱門講座首度出版,原因有三: 首先,希望讓更多讀者了解資料科學,培養資料分析技能。資訊時代各行各業都需要資料分析的人才,了解應該具備哪些知識、有何種處理手法、能達成什麼樣的目標,善用資料科學將是致勝的關鍵。 其次,雖然線上資源豐富又方便取得,但並非隨時都能在線上學習。藉由書籍的形式,可因地制宜反覆演練複習。 第三,以學習效果來說,書本的編排有助於深入思考,成效更佳。 █ 本書的目標讀者 ▌有程式設計經驗、完成理科大一大二程度數學,以及對於學習資料科學有高度意願的一般人士 ▌藉由本書,可掌握資料科學入門程度至中級程度的內容,已達中級程度以上者也能參酌本書來複習資料分析相關知識 ▌對於目前備受矚目的深度學習,可透過本書掌握學習深度學習之前必需的基礎技能 █ 在本書裡學到的東西 ▌Python/Numpy/Scipy/Pandas/Matplotlib的基礎 ▌機率/統計/推論/迴歸的基礎 ▌使用Numpy/Scipy進行科學計算 ▌使用Pandas進行資料加工處理(遺漏資料/異常值的處理、時間序列資料的處理) ▌使用Matplotlib進行資料視覺化 ▌機器學習(多元線性迴歸、邏輯迴歸、決策樹、k-NN、聚類分析、主成分分析、購物籃分析、模型調校) 作者簡介 譯者介紹 目錄 序言 【Chapter 1 本書的概要與Python的基礎】 ▌1-1 資料科學家的工作 1-1-1 資料科學家的工作 1-1-2 資料分析的流程 1-1-3 本書的架構 1-1-4 對閱讀本書有幫助的文獻 1-1-5 動手來學習吧 ▌1-2 Python的基礎 1-2-1 Jupyter Notebook的使用方法 1-2-2 Python的基礎 1-2-3 串列型別與字典型別 1-2-4 條件分歧與迴圈 1-2-5 函式 1-2-6 類別與實例 【Chapter 2 科學計算、資料加工、圖形描繪函式庫的使用方法基礎】 ▌2-1 用於資料分析的函式庫 2-1-1 函式庫的匯入 2-1-2 Magic Command 2-1-3 匯入用於本章的函式庫 ▌2-2 Numpy的基礎 2-2-1 Numpy的匯入 2-2-2 陣列的操作 2-2-3 亂數 2-2-4 矩陣 ▌2-3 Scipy的基礎 2-3-1 Scipy的函式庫匯入 2-3-2 矩陣運算 2-3-3 牛頓法 ▌2-4 Pandas的基礎 2-4-1 Pandas的函式庫匯入 2-4-2 Series的使用方法 2-4-3 DataFrame的使用方法 2-4-4 行列的操作 2-4-5 資料的抽出 2-4-6 資料的刪除與結合 2-4-7 統計 2-4-8 值的排序 2-4-9 nan (null)的判斷 ▌2-5 Matplotlib的基礎 2-5-1 使用Matplotlib的準備工作 2-5-2 散佈圖 2-5-3 圖形的分割 2-5-4 函數圖形的描繪 2-5-5 直方圖 【Chapter 3 敘述統計與簡單迴歸分析】 ▌3-1 統計分析的種類 3-1-1 敘述統計與推論統計 3-1-2 匯入用於本章的函式庫 ▌3-2 資料的讀取與對話 3-2-1 讀取網路等處公開的對象資料 3-2-2 資料的讀取與確認 3-2-3 確認資料的性質 3-2-4 量的資料與質的資料 ▌3-3 敘述統計 3-3-1 直方圖 3-3-2 平均、中位數、眾數 3-3-3 變異數、標準差 3-3-4 摘要統計量與百分位數 3...