姆斯Python網路爬蟲:大數據擷取、清洗、儲存與分析 王者歸來(第二版) 洪錦魁 深智數位 9789860776478  華通書坊/姆斯
找相似
商品已停售

姆斯Python網路爬蟲:大數據擷取、清洗、儲存與分析 王者歸來(第二版) 洪錦魁 深智數位 9789860776478 華通書坊/姆斯

台灣樂天市場
訂單成立賺0.5%
下單享LINE POINTS點數
訂單成立賺0.5% 3
台灣樂天市場

台灣樂天市場

▐ 自2024/1/1 00:00起,台灣樂天市場「屈臣氏」將不贈送 LINE POINTS 點數 ▐ 自2023/2/1 00:00起,樂天Kobo電子書不贈送 LINE POINTS 點數,請會員多加留意。 ▐ LINE POINT點數回饋依照樂天提供扣除折價券(優惠券)、與運費後之最終金額進行計算。 ▐ 愛買與愛票網、a la sha(2023/8/1生效)、GAME休閒館(2023/8/1生效)、專品藥局(2023/8/1生效)等部分店家不參與全站加碼,請詳閱LINE Points 加碼店家清單:https://lin.ee/Y2CcVdk/rcfk ▐ 注意事項 (1)部分服務及店家不符合贈點資格,購買後將不贈送 LINE Points 點數,亦不得使用點數紅包,如:比漾廣場、神腦生活、MyCard、愛美麗福利社、展翔通訊、ezcook 美食廚房、葳豐數位商城、吉盈數位商城、森林巨人、包材中心、KABO佳麗寶家電批發、LuLuLu精品店、NewSTYLE新風尚潮流、0216零食會社、美寶家電、純米小鋪、LILY科技新櫃、登芳3C電子雜貨賣場、豐饌御鴨、鼎耀通訊、誠選3C、Smile、葳豐數位商城二店、米蘭寶、BoBo Outlet代購屋、楊家食品(2022/10/1生效)、樂天Kobo電子書(2023/2/1生效)、屈臣氏(2024/1/1生效)等,請詳閱LINE Points 加碼店家清單。 (2)需透過LINE購物前往台灣樂天市場,並在同一瀏覽器於24小時內結帳,才享有 LINE Points 回饋。 (3)若購買之訂單(包含預購商品)未符合樂天市場 45 天內完成訂單出貨及結帳,則不符合贈點資格。 (4)如使用App、或中途瀏覽比價網、回饋網、Google等其他網頁、或由網頁版(電腦版/手機版網頁)切換為App都將會造成追蹤中斷而無法進行 LINE Points 回饋。 (5) LINE 購物為購物資訊整合性平台,商品資料更新會有時間差,如顯示之商品規格、顏色、價位、贈品與台灣樂天市場銷售網頁不符,以銷售網頁標示為準。 (6)Pickup店家之有效訂單需於下單後40天內使用完畢才符合分潤條件 (7) 若上述或其他原因,致使消費者無接收到點數回饋或點數回饋有爭議,台灣樂天市場保有更改條款與法律追訴之權利,活動詳情以樂天市場網站公告為準。

商品描述

Python網路爬蟲:大數據擷取、清洗、儲存與分析 王者歸來 ISBN13:9789860776478 出版社:深智數位 作者:洪錦魁 裝訂/頁數:平裝/552頁 規格:23cm*17cm*2.8cm (高/寬/厚) 版次:2 出版日:2021/10/19 中國圖書分類:電腦程式語言 內容簡介 Python網路爬蟲 大數據擷取、清洗、儲存與分析 王者歸來(第二版) ★★★本書第一版是【博客來2020年】【電腦書年度暢銷榜第3名】★★★ ★★★★★【26個主題】+【400個實例】★★★★★ ★★★★★從【零】開始的【網路爬蟲入門書籍】★★★★★ ★★★★★大數據【擷取】、【清洗】、【儲存與分析】★★★★★ ★★★★★【網路趨勢】+【了解輿情】★★★★★   第二版和第一版做比較,增加下列內容:   ★:全書增加約50個程式實例   ★:網路趨勢,了解輿情   ★:網路關鍵字查詢   ★:YouBike資訊   ★:國際金融資料查詢   ★:博客來圖書排行榜   ★:中央氣象局   ★:租屋網站   ★:生活應用   下列是本書有關網路爬蟲知識的主要內容:   ★:認識搜尋引擎與網路爬蟲   ★:認識約定成俗的協議robots.txt   ★:從零開始解析HTML網頁   ★:認識與使用Chrome開發人員環境解析網頁   ★:認識Python內建urllib、urllib2模組,同時介紹好用的requests模組   ★:說明lxml模組   ★:XPath方法解說   ★:css定位網頁元素   ★:Cookie觀念   ★:自動填寫表單   ★:使用IP代理服務與實作   ★:偵測IP   ★:更進一步解說更新的模組Requests-HTML   ★:認識適用大型爬蟲框架的Scrapy模組   在書籍內容,筆者設計爬蟲程式探索下列相關網站:   ☆:國際與國內股市資訊   ☆:基金資訊   ☆:股市數據   ☆:人力銀行   ☆:維基網站   ☆:主流媒體網站   ☆:政府開放數據網站   ☆:YouBike服務網站   ☆:PTT網站   ☆:電影網站   ☆:星座網站   ☆:小說網站   ☆:博客來網站   ☆:中央氣象局   ☆:露天拍賣網站   ☆:httpbin網站   ☆:python.org網站   ☆:github.com網站   ☆:ipstack.com網站API實作   ☆:Google API實作   ☆:Facebook API實作   探索網站成功後,筆者也說明下列如何下載或儲存不同資料格式的數據:   ★:CSV檔案格式   ★:JSON檔案格式   ★:XML、Pickle   ★:Excel   ★:SQLite   在設計爬蟲階段我們可能會碰上一些技術問題,筆者也以實例解決下列相關問題:   ☆:URL編碼與中文網址觀念   ☆:將中文儲存在JSON格式檔案   ☆:亂碼處理   ☆:簡體中文在繁體中文Windows環境資料下載與儲存   ☆:解析Ajax動態加載網頁,獲得更多頁次資料   ☆:使用Chromium瀏覽器協助Ajax動態加載 目錄 第零章 認識網路爬蟲 0-1 認識HTML 0-2 網路地址URL 0-3 爬蟲的類型 0-4 搜尋引擎與爬蟲原理 0-5 網路爬蟲的搜尋方法 0-6 網路爬蟲是否合法 0-7 認識HTTP 與HTTPS 0-8 表頭(headers) 第一章 JSON 資料與繪製世界地圖 1-1 JSON 資料格式前言 1-2 認識json 資料格式 1-3 將Python 應用在json 字串形式資料 1-4 將Python 應用在json 檔案 1-5 簡單的json 檔案應用 1-6 世界人口數據的json 檔案 1-7 繪製世界地圖 1-8 XML 第二章 使用Python 處理CSV 文件 2-1 建立一個CSV 文件 2-2 用記事本開啟CSV 檔案 2-3 csv 模組 2-4 讀取CSV 檔案 2-5 寫入CSV 檔案 2-6 寫入與讀取含中文的 CSV 文件 2-7 專題—使用 CSV 檔案繪製氣象圖表 2-8 pickle 模組 2-9 Python 與Microsoft Excel 第三章 網路爬蟲基礎實作 3-1 上網不再需要瀏覽器了 3-2 下載網頁資訊使用 requests 模組 3-3 檢視網頁原始檔 3-4 分析網站使用Chrome 開發人員工具 3-5 下載網頁資訊使用urllib 模組 3-6 認識httpbin 網站 3-7 認識Cookie 3-8 設置代理IP 第四章 Pandas 模組 4-1 Series 4-2 DataFrame 4-3 基本Pandas 資料分析與處理 4-4 檔案的輸入與輸出 4-5 Pandas 繪圖 4-6 時間序列(Time Series) 4-7 專題—鳶尾花 4-8 專題—匯入網頁表格資料 第五章 BeautifulSoup 解析網頁 5-1 解析網頁使用BeautifulSoup 模組 5-2 其它HTML 文件解析 5-3 網路爬蟲實戰—圖片下載 5-4 網路爬蟲實戰—找出台灣彩券公司最新一期威力彩開獎結果 5-5 網路爬蟲實戰—列出Yahoo 焦點新聞標題和超連結 5-6 IP 偵測網站 FileFab 第六章 網頁自動化 6-1 hashlib 模組 6-2 環保署空氣品質JSON 檔案實作 6-3 檢測網站內容是否更新 6-4 工作排程與自動執行 6-5 環保署空氣品質的CSV 檔案 第七章 Selenium 網路爬蟲的王者 7-1 順利使用Selenium 工具前的安裝工作 7-2 獲得webdriver 的物件型態 7-3 擷取網頁 7-4 尋找HTML 文件的元素 7-5 XPath 語法 7-6 用Python 控制點選超連結 7-7 用Python 填寫表單和送出 7-8 用Python 處理使用網頁的特殊按鍵 7-9 用Python 處理瀏覽器運作 7-10 自動化下載環保署空氣品質資料 第八章 PTT 爬蟲實戰 8-1 認識批踢踢實業坊 8-2 進入PTT 網址 8-3 解析PTT 進入須滿18 歲功能鈕 8-4 各篇文章的解析 8-5 解析文章標題與作者 8-6 推文數量 8-7 文章發表日期 8-8 將PTT 目前頁面內容以JSON 檔案儲存 8-9 前一頁面處理的說明 8-10 進入PPT 的beauty 論壇網站 8-11 ipstack 第九章 Yahoo 奇摩電影網站 9-1 本週新片 9-2 中文片名和英文片名 9-3 上映日期 9-4 期待度 9-5 影片摘要 9-6 劇照海報 9-7 爬取兄弟節點 9-8 預告片 9-9 排行榜 第十章 台灣主流媒體網站 10-1 蘋果日報 10-2 聯合報 10-3 經濟日報 10-4 中國時報 10-5 工商時報 第十一章 Python 與SQLite 資料庫 11-1 SQLite 基本觀念 11-2 資料庫連線 11-3 SQLite 資料類型 11-4 建立SQLite 資料庫表單 ...

加入購物車

設定到價通知

商品已停售