Python網路爬蟲:大數據擷取、清洗、儲存與分析-王者歸來[二手書_良好]11316496581 TAAZE讀冊生活網路書店
1. 透過LINE購物進入蝦皮後禁止再透過蝦皮直播下單,避免訂單認列異常
2. 請務必「清空」蝦皮購物車,再透過LINE購物連結至蝦皮商店進行購買 ;先把商品加入購物車,再從LINE購物連結至蝦皮結帳,將無法獲得點數回饋。
3. 請避免連續下單,若您完成交易後,想下第二張訂單,請重新從LINE購物連結至蝦皮商店進行購買
4. 電子票券及繳費服務類別:回饋0%。
5. 請留意,蝦皮超市內的商品(蝦皮超市、蝦皮直送美妝、蝦皮免運直送)不隸屬於蝦皮商城,點數回饋請依照「蝦皮超市」商店頁為主。
6. 蝦皮商城之訂單適用於部分點數紅包,規範請依該紅包頁說明為主。
7. 點數回饋將依照蝦皮提供扣除折價券、運費與蝦幣後之最終金額進行計算。
8. 同一商品品項(即便不同尺寸規格),皆會計入同一筆返點上限進行計算
9. 用戶需於同一瀏覽器進行交易(若自動跳轉 APP,請在 APP交易)。
10. 若使用不同物流或付款方式,將拆分成不同筆訂單編號發送通知。
11. 若使用折價券折抵,可能會有攤提折抵導致訂單金額些微落差
12. 蝦皮會將LINE的導購跳轉紀錄與蝦皮的會員ID進行綁定,若後續七天內未透過其他媒體來源導入蝦皮官網,則七天內於該蝦皮帳號下訂的首筆訂單會被蝦皮認列為該LINE用戶導購跳轉時所成立之訂單。
13. 若同一用戶使用一個以上蝦皮帳號透過LINE購物進行導購,將可能導致無法收到導購通知,亦可能無法收到點數,再請留意。
[注意事項]
1.如導購途中用戶由網頁版(電腦版/手機版網頁)切換為 App 會造成追蹤中斷而無法進行 LINE Points 回饋
2.若購買過程中關閉蝦皮APP,則需重新透過LINE購物前往蝦皮商城,否則無法進行LINE POINTS 回饋。 / 3.如用戶先前往蝦皮商城將商品加入購物車,後續透過LINE購物前往至蝦皮商城將購物車結清,此方案將不列入 LINE Points 回饋
4.若因系統異常無法追蹤訂單,致使消費者無接收到點數回饋,蝦皮保有更改條款與法律追訴之權利
5. LINE購物商品價格若與蝦皮賣場實際價格有異,以蝦皮賣場價格為準商品描述
商品資料
作者:洪錦魁
出版社:深智數位股份有限公司
出版日期:2019/10/23
ISBN/ISSN:9789865501020
語言:繁體/中文
裝訂方式:平裝
頁數:560
原價:650
------------------------------------------------------------------------
內容簡介
這是一本使用Python從零開始指導讀者的網路爬蟲入門書籍,全書以約350個程式實例,完整解說大數據擷取、清洗、儲存與分析相關知識,下列是本書有關網路爬蟲知識的主要內容。
# 認識搜尋引擎與網路爬蟲
# 認識約定成俗的協議
# 從零開始解析HTML網頁
# 認識與使用Chrome開發人員環境解析網頁
# 認識Python內建urllib、urllib2模組,同時介紹好用的requests模組
# 說明lxml模組
# Selenium模組
# XPath方法解說
# css定位網頁元素
# Cookie觀念
# 自動填寫表單
# 使用IP代理服務與實作
# 偵測IP
# 更進一步解說更新的模組Requests-HTML
# 認識適用大型爬蟲框架的Scrapy模組
在書籍內容,本書設計爬蟲程式探索下列相關網站,讀者可以由不同的網站主題,深入測試自己設計網路爬蟲的能力,以適應未來職場的需求。
# 金融資訊
# 股市數據
# 人力銀行
# 交友網站
# 維基網站
# 主流媒體網站
# 政府開放數據網站
# 社群服務網站
# PTT網站
# 電影網站
# 星座網站
# 小說網站
# 台灣高鐵
# 露天拍賣網站
# httpbin網站
# python.org網站
# github網站
# ipstack網站API實作
# Google API實作
#
探索網站成功後,本書也說明下列如何下載或儲存不同資料格式的數據。
# CSV檔案格式
# JSON檔案格式
# XML、Pickle
# Excel
# SQLite資料庫
本書沿襲作者著作的特色,程式實例豐富,相信讀者只要遵循本書內容必定可以在最短時間精通Python網路爬蟲設計。
作者簡介
洪錦魁
一位跨越電腦作業系統與科技時代的電腦專家,著作等身的作家。
■ DOS 時代他的代表作品是 IBM PC 組合語言、C、C++、Pascal、資料結構。
■ Windows 時代他的代表作品是 Windows Programming 使用 C、Visual Basic。
■ Internet 時代他的代表作品是網頁設計使用 HTML。
■ 大數據時代他的代表作品是 R 語言邁向 B
除了作品被翻譯為簡體中文、馬來西亞文外,2000 年作品更被翻譯為Mastering HTML 英文版行銷美國。
近年來作品則是在北京清華大學和台灣深智同步發行:
1:Java 入門邁向高手之路王者歸來
2:Python 入門邁向高手之路王者歸來
3:HTML5 + CSS3 王者歸來
4:R 語言邁向B
他的著作最大的特色是,所有程式語法會依特性分類,同時以實用的程式範例做解說,讓整本書淺顯易懂,讀者可以由他的著作事半功倍輕鬆掌握相關知識。
二手書購物須知
1. 購買二手書時,請檢視商品書況或書況影片。商品名稱後方編號為賣家來源。
2. 商品版權法律說明:TAAZE 讀冊生活單純提供網路二手書託售平台予消費者,並不涉入書本作者與原出版商間之任何糾紛;敬請各界鑒察。
3. 二手商品無法提供換貨服務,僅能辦理退貨。如須退貨,請保持該商品及其附件的完整性(包含書籍封底之TAAZE物流條碼)。若退回商品無法回復原狀者,可能影響退換貨權利之行使或須負擔部分費用。
4. 退換貨說明:二手書籍商品享有15天的商品猶豫期(含例假日)。若您欲辦理退貨,請於取得該商品15日內寄回。但以下幾種狀況不得辦理退貨:
a. 與書況影片相較有差異(撞損..)
b. 附件不符(原有含CD)
c. 物流條碼被撕除
訂購本商品前請務必詳閱退換貨原則。
5. 書況標定 : 二手書「書況」由讀冊生活統一標定,標準如下,下單前請先確認該商品書況,若下單則視為確認及同意書況。
a. 全新:膠膜未拆,無瑕疵。
b. 近全新:未包膜,翻閱痕跡不明顯,如實體賣場陳列販售之書籍。
c. 良好:有使用痕跡,不如新書潔白、小範圍瑕疵,如摺角、碰撞、汙點或泛黃等。
d. 普通:有明顯使用痕跡或黃褐色、黑斑等。