研發資源

 

Python 網路爬蟲: 大數據擷取、清洗、儲存與分析:王者歸來 /洪錦魁著

出版項
臺北市 深智數位 2019
語文
中文
稽核項
1冊 圖 23公分
ISBN
9789865501020 平裝 650
條碼號保管單位架區索書號/卷期流通情形預約/申調數
C024004資策會資料中心圖書區B 005.2 3482 2019借出中(2022/07/22歸還)
請登入會員
 
PB00017742產業情報研究所  請登入會員 
PB00017722軟體技術研究院  請登入會員 
PB00017699數位轉型研究院  請登入會員 

內容簡介

這是一本使用Python從零開始指導讀者的網路爬蟲入門書籍,全書以約350個程式實例,完整解說大數據擷取、清洗、儲存與分析相關知識,下列是本書有關網路爬蟲知識的主要內容。
˙認識搜尋引擎與網路爬蟲
˙認識約定成俗的協議robots.txt
˙從零開始解析HTML網頁
˙認識與使用Chrome開發人員環境解析網頁
˙認識Python內建urllib、urllib2模組,同時介紹好用的requests模組
˙說明lxml模組
˙Selenium模組
˙XPath方法解說
˙css定位網頁元素
˙Cookie觀念
˙自動填寫表單
˙使用IP代理服務與實作
˙偵測IP
˙更進一步解說更新的模組Requests-HTML
˙認識適用大型爬蟲框架的Scrapy模組

本書沿襲作者著作的特色,程式實例豐富,相信讀者只要遵循本書內容必定可以在最短時間精通Python網路爬蟲設計。

推薦延伸閱讀

借過該書還借過哪些書?