商品描述
以下書況,主觀上皆可閱讀,若收到後不滿意,『都可退書退款』。 書況補充說明: D 多處摺頁標籤、水痕、字跡、破損、髒污、泛黃書斑、書章。 【購買須知】 (1)照片皆為現貨實際拍攝,請參書況說明。 (2)『賣場標題、內容簡介』為出版社原本資料,若有疑問請留言,但人力有限,恕不提供大量詢問。 (3)『附件或贈品』,不論標題或內容簡介是否有標示,請都以『沒有附件,沒有贈品』為參考。 (4)訂單完成即『無法加購、修改、合併』,請確認品項、優惠後,再下訂結帳。如有疑問請留言告知。 (5)二手書皆為獨立商品,下訂即刪除該品項,故『取消』後無法重新訂購,須等系統安排『2個月後』重新上架。 (6)收到書籍後,若不滿意,或有缺漏,『都可退書退款』。 [商品主貨號] U102759832 [代售商品編號] 101396900339 [ISBN-13碼] 9789864343386 [ISBN] 9864343386 [作者] 林俊瑋, 林修博 [出版社] 博碩 [出版日期] 2018/10/04 [裝訂/規格] 平裝 / 256頁 / 17 x 23 x 1.28 cm / 普通級 / 單色印刷 / 初版 [目錄] Chapter 01 環境設定與網頁爬蟲初探 1-1 環境設定及套件安裝:Anaconda 1-2 使用IDE:PyCharm 1-3 使用Jupyter Notebook 1-4 網頁文件解構與網頁爬蟲初探 Chapter 02 Beautiful Soup 講解與網頁解構 2-1 不要重複造輪子:寫爬蟲之前 2-2 Beautiful Soup 重要功能 (find(), find_all(), .text, .stripped_strings) 2-3 網頁結構巡覽(parent, children, siblings) 2-4 正規表示式 (Regular Expression) Chapter 03 網頁爬蟲範例實戰 3-1 PTT 八卦板今日熱門文章 3-2 Yahoo 奇摩電影本週新片 3-3 兩大報當日焦點新聞 3-4 Google 搜尋股價資訊 3-5 Dcard 今日熱門文章 Chapter 04 使用 API 4-1 API 簡介 4-2 PTT 八卦板眾來源分佈 (ipstack.com) 4-3 IMDB API 4-4 Google Maps APIs (Google Geocoding/Places API) 4-5 Dcard API Chapter0 5 資料儲存 5-1 儲存圖片與多媒體檔案 5-2 儲存資料到 CSV 檔 5-3 儲存資料到資料庫 SQLite Chapter 06 不同編碼與類型的文件 6-1 非 UTF-8 編碼的文件 6-2 XML 文件 Chapter 07 進階爬蟲議題 7-1 處理表單及登入頁 :台灣高鐵時刻查詢 7-2 處理表單及登入頁 :Yelp 登入 7-3 使用WebDriver:台銀法拍屋資訊查詢 7-4 爬蟲程式經驗談:被封鎖的常見原因、常用 Header 欄位、網站隱藏欄位、使用代理伺服器 Chapter 08 資料分析實戰 8-1 台股每日盤後資訊爬蟲及策略回測(量化投資) 8-2 電影評論情緒分析(中文自然語言處理與機器學習) 8-3 商品特價 Gmail 通知:Costco 商品網頁 附表 本書範例目標網站列表 附錄A 在 Mac 安裝Anaconda 開發環境 附錄B Python 爬蟲框架Scrapy 入門教學 B-1 Scrapy 環境安裝 B-2 簡易部落格爬蟲 B-3 Scrapy 系統架構 B-4 博客來網路書店爬蟲 [內容簡介] (出版商制式文字, 不論標題或內容簡介是否有標示, 請都以『沒有附件、沒有贈品』為參考。) 想自動化生活瑣事?想透過程式擷取網路上的公開資訊?學了Python卻不知道有什麼實際應用?正在尋找入門難度低且成就感高的Python專案?想知道網路爬蟲如何與資料分析結合?本書一次教給你! 本書特色: ● 基於熱門線上課程與實體教學的學員迴響重新編寫及增補而成的實戰書籍 ● 以台灣讀者熟悉的網站為範例(PTT、Dcard、台灣證交所、蘋果日報網站、Yahoo奇摩電影、Google Maps API、IMDB電影資料庫等)的Python網路爬蟲程式教學 ● 由淺入深,以實務需求為導向,涵蓋爬蟲常用函式庫、資料儲存、文件編碼、表單及登入頁處理、爬蟲程式被封鎖的常見原因等經驗談 ● 全新的資料分析章節,包含三個爬蟲程式的經典應用:量化投資、影評情緒分析與商品特價通知 本書適合閱讀的對象: ● 對網路爬蟲程式或資料分析有興趣者 ● 想自動化生活瑣事(例如自動追蹤網站特價通知、節省資料收集的時間等),化被動資訊接收為主動 ● Python新手或入門級讀者(知道何謂變數、if 判斷式與迴圈,寫過一些小程式),想練習低門檻及高成就感的Python專案 目錄 Chapter 01 環境設定與網頁爬蟲初探 1-1 環境設定及套件安裝:Anaconda 1-2 使用IDE:PyCharm 1-3 使用Jupyter Notebook 1-4 網頁文件解構與網頁爬蟲初探 Chapter 02 Beautiful Soup 講解與網頁解構 2-1 不要重複造輪子:寫爬蟲之前 2-2 Beautiful Soup 重要功能 (find(), find_all(), .text, .stripped_strings) 2-3 網頁結構巡覽(parent, children, siblings) 2-4 正規表示式 (Regular Expression) Chapter 03 網頁爬蟲範例實戰 3-1 PTT 八卦板今日熱門文章 3-2 Yahoo 奇摩電影本週新片 3-3 兩大報當日焦點新聞 3-4 Google 搜尋股價資訊 3-5 Dcard 今日熱門文章 Chapter 04 使用 API 4-1 API 簡介 4-2 PTT 八卦板眾來源分佈 (ipstack.com) 4-3 IMDB API 4-4 Google Maps APIs (Google Geocoding/Places API) 4-5 Dcard API Chapter0 5 資料儲存 5-1 儲存圖片與多媒體檔案 5-2 儲存資料到 CSV 檔 5-3 儲存資料到資料庫 SQLite Chapter 06 不同編碼與類型的文件 6-1 非 UTF-8 編碼的文件 6-2 XML 文件 Chapter 07 進階爬蟲議題 7-1 處理表單及登入頁 :台灣高鐵時刻查詢 7-2 處理表單及登入頁 :Yelp 登入 7-3 使用WebDriver:台銀法拍屋資訊查詢 7-4 爬蟲程式經驗談:被封鎖的常見原因、常用 Header 欄位、網站隱藏欄位、使用代理伺服器 Chapter 08 資料分析實戰 8-1 台股每日盤後資訊爬蟲及策略回測(量化投資) 8-2 電影評論情緒分析(中文自然語言處理與機器學習) 8-3 商品特價 Gmail 通知:Costco 商品網頁 附表 本書範例目標網站列表 附錄A 在 Mac 安裝Anaconda 開發環境 附錄B Python 爬蟲框架Scrapy 入門教學 B-1 Scrapy 環境安裝 B-2 簡易部落格爬蟲 B-3 Scrapy 系統架構 B-4 博客來網路書店爬蟲 林俊瑋 熱門開源專案「PTT網路版爬蟲」作者。加州大學爾灣分校(UC Irvine)博士候選人,研究領域為軟體測試自動化,曾執行包含網頁及手機 App 爬蟲實作的多個研究專案,也曾在國外知名研究機構及國內軟體公司實習,並有多年政府資訊部門工作與介接政府開放資料經驗。 林修博 台灣大學電子工程研究所畢業,目前任職於軟體公司擔任全端工程師。有多年爬蟲撰寫經驗,並且將其商用化。) ---------------------------------------------------------------------------------------------------- 分享閱讀 書籍狀態請詳看圖示 如對商品有疑問請使用「聯絡店家」發問,發問時請告知完整商品名稱 ■客服電話服務時間: 敝店客服電話 (02) 85316044 服務時間為週一至週五 09:00-12:00 及 13:00-17:00,例假日與國定假日公休 其餘時間請使用 聯絡店家 功能聯繫 。 由於敝店為多平臺同步販售,來電請務必告知為樂天買家以節省您的寶貴時間,謝謝您。 ■其他注意事項: 建議可多利用7-11取貨付款,可在自己方便的時間領貨。