最新人工智慧應用：用強化學習快速上手AI[二手書_良好]11315001636 TAAZE讀冊生活網路書店

Name: 最新人工智慧應用：用強化學習快速上手AI[二手書_良好]11315001636 TAAZE讀冊生活網路書店
Price: 298 TWD

蝦皮商城

1. 透過LINE購物進入蝦皮後禁止再透過蝦皮直播下單，避免訂單認列異常 2. 請務必「清空」蝦皮購物車，再透過LINE購物連結至蝦皮商店進行購買；先把商品加入購物車，再從LINE購物連結至蝦皮結帳，將無法獲得點數回饋。 3. 請避免連續下單，若您完成交易後，想下第二張訂單，請重新從LINE購物連結至蝦皮商店進行購買 4. 電子票券及繳費服務類別：回饋０％。 5. 請留意，蝦皮超市內的商品（蝦皮超市、蝦皮直送美妝、蝦皮免運直送）不隸屬於蝦皮商城，點數回饋請依照「蝦皮超市」商店頁為主。 6. 蝦皮商城之訂單適用於部分點數紅包，規範請依該紅包頁說明為主。 7. 點數回饋將依照蝦皮提供扣除折價券、運費與蝦幣後之最終金額進行計算。 8. 同一商品品項(即便不同尺寸規格)，皆會計入同一筆返點上限進行計算 9. 用戶需於同一瀏覽器進行交易（若自動跳轉 APP，請在 APP交易）。 10. 若使用不同物流或付款方式，將拆分成不同筆訂單編號發送通知。 11. 若使用折價券折抵，可能會有攤提折抵導致訂單金額些微落差 12. 蝦皮會將LINE的導購跳轉紀錄與蝦皮的會員ID進行綁定，若後續七天內未透過其他媒體來源導入蝦皮官網，則七天內於該蝦皮帳號下訂的首筆訂單會被蝦皮認列為該LINE用戶導購跳轉時所成立之訂單。 13. 若同一用戶使用一個以上蝦皮帳號透過LINE購物進行導購，將可能導致無法收到導購通知，亦可能無法收到點數，再請留意。 [注意事項] 1.如導購途中用戶由網頁版(電腦版/手機版網頁)切換為 App 會造成追蹤中斷而無法進行 LINE Points 回饋 2.若購買過程中關閉蝦皮APP，則需重新透過LINE購物前往蝦皮商城，否則無法進行LINE POINTS 回饋。 / 3.如用戶先前往蝦皮商城將商品加入購物車，後續透過LINE購物前往至蝦皮商城將購物車結清，此方案將不列入 LINE Points 回饋 4.若因系統異常無法追蹤訂單，致使消費者無接收到點數回饋，蝦皮保有更改條款與法律追訴之權利 5. LINE購物商品價格若與蝦皮賣場實際價格有異，以蝦皮賣場價格為準

商品描述

商品資料作者：郭憲、方勇純出版社：佳魁數位出版日期：2018/06/08 ISBN/ISSN：9789863796541 語言：繁體/中文裝訂方式：平裝頁數：304 原價：580 ------------------------------------------------------------------------ 內容簡介本書特色： ❑風格偏向口語化，透過此種交流方式，實現一對一的訓練效果。讀者可將本書想像成自己的私人家教！ ❑不將數學基礎單獨列出，而是在章節內容中，對應地介紹演算法設計和分析的數學基礎。即使沒有高深數學功力的讀者也可學習。而針對有基礎者，透過將兩者加以結合，更可提升數學的應用能力！ ❑每部分都包含「理論說明」、「程式說明」與「直觀解釋」三項內容。強化學習演算法之應用性相當強大，大多讀者的學習目的是用來解決實際問題。一邊學理論、一邊寫程式，過程中同步提升理論研究與解決問題的能力！ ❑涵蓋內容相當豐富，從最基礎到目前最先進的強化學習演算法都有所涉獵！ ------------------------------------------------------------------------- 適用：本書既適合零基礎之強化學習初學者，亦適合相關領域之從業人員與大學、研究所師生。目錄 Chapter 01 緒論 1.1 這是一本什麼書 1.2 強化學習可以解決什麼問題 1.3 強化學習如何解決問題 1.4 強化學習演算法分類及發展趨勢 1.5 強化學習模擬環境建置 1.6 本書主要內容及安排 Chapter 02 馬可夫決策過程 2.1 馬可夫決策過程理論說明 2.2 MDP中的機率學基礎說明 2.3 以gym為基礎的MDP實例說明 2.4 習題 Chapter 03 以模型為基礎的動態規劃方法 3.1 以模型為基礎的動態規劃方法理論 3.2 動態規劃中的數學基礎說明 3.3 以gym為基礎的程式設計實例 3.4 最佳控制與強化學習比較 3.5 習題 Chapter 04 以蒙地卡羅為基礎的強化學習方法 4.1 以蒙地卡羅方法為基礎的理論 4.2 統計學基礎知識 4.3 以Python為基礎的程式設計實例 4.4 習題 Chapter 05 以時間差分為基礎的強化學習方法 5.1 基於時間差分強化學習演算法理論說明 5.2 以Python和gym為基礎的程式設計實例 5.3 習題 Chapter 06 以值函數逼近為基礎的強化學習方法 6.1 以值函數逼近為基礎的理論說明 6.2 DQN及其變種 6.3 函數逼近方法 6.4 習題 Chapter 07 以策略梯度為基礎的強化學習方法 7.1 以策略梯度為基礎的強化學習方法理論說明 7.2 以gym和TensorFlow為基礎的策略梯度演算法實現 7.3 習題 Chapter 08 以置信域策略最佳化為基礎的強化學習方法 8.1 理論基礎 8.2 TRPO中的數學知識 8.3 習題 Chapter 09 以確定性策略搜索為基礎的強化學習方法 9.1 理論基礎 9.2 習題 Chapter 10 以啟動策略搜索為基礎的強化學習方法 10.1 理論基礎 10.2 GPS中有關的數學基礎 10.3 習題 Chapter 11 逆向強化學習 11.1 概述 11.2 以最大邊際為基礎的逆向強化學習 11.3 以最大熵為基礎的逆向強化學習 11.4 習題 Chapter 12 組合策略梯度和值函數方法 Chapter 13 值反覆運算網路 13.1 為什麼要提出值反覆運算網路 13.2 值反覆運算網路 Chapter 14 以模型為基礎的強化學習方法：PILCO及其擴充 14.1 概述 14.2 PILCO 14.3 濾波PILCO和探索PILCO 14.4 深度PILCO A 後記 B 參考文獻二手書購物須知 1. 購買二手書時，請檢視商品書況或書況影片。商品名稱後方編號為賣家來源。 2. 商品版權法律說明：TAAZE 讀冊生活單純提供網路二手書託售平台予消費者，並不涉入書本作者與原出版商間之任何糾紛；敬請各界鑒察。 3. 二手商品無法提供換貨服務，僅能辦理退貨。如須退貨，請保持該商品及其附件的完整性(包含書籍封底之TAAZE物流條碼)。若退回商品無法回復原狀者，可能影響退換貨權利之行使或須負擔部分費用。 4. 退換貨說明：二手書籍商品享有15天的商品猶豫期（含例假日）。若您欲辦理退貨，請於取得該商品15日內寄回。但以下幾種狀況不得辦理退貨： a. 與書況影片相較有差異(撞損..) b. 附件不符(原有含CD) c. 物流條碼被撕除訂購本商品前請務必詳閱退換貨原則。 5. 書況標定 : 二手書「書況」由讀冊生活統一標定，標準如下，下單前請先確認該商品書況，若下單則視為確認及同意書況。 a. 全新：膠膜未拆，無瑕疵。 b. 近全新：未包膜，翻閱痕跡不明顯，如實體賣場陳列販售之書籍。 c. 良好：有使用痕跡，不如新書潔白、小範圍瑕疵，如摺角、碰撞、汙點或泛黃等。 d. 普通：有明顯使用痕跡或黃褐色、黑斑等。

加入購物車

設定到價通知

商品已停售