Python 網路爬蟲: 大數據擷取、清洗、儲存與分析:王者歸來 /洪錦魁著
- 出版項
- 臺北市 深智數位 2019
- 語文
- 中文
- 稽核項
- 1冊 圖 23公分
- ISBN
- 9789865501020 平裝 650
條碼號 | 保管單位 | 架區 | 索書號/卷期 | 流通情形 | 預約/申調數 |
C024004 | 資策會資料中心 | 圖書區 | B 005.2 3482 2019 | 請登入會員 | |
PB00017742 | 產業情報研究所 | | | 請登入會員 | |
PB00017722 | 數位轉型研究院 | | | 請登入會員 | |
PB00017699 | 數位轉型研究院 | | | 請登入會員 | |
內容簡介
這是一本使用Python從零開始指導讀者的網路爬蟲入門書籍,全書以約350個程式實例,完整解說大數據擷取、清洗、儲存與分析相關知識,下列是本書有關網路爬蟲知識的主要內容。
˙認識搜尋引擎與網路爬蟲
˙認識約定成俗的協議robots.txt
˙從零開始解析HTML網頁
˙認識與使用Chrome開發人員環境解析網頁
˙認識Python內建urllib、urllib2模組,同時介紹好用的requests模組
˙說明lxml模組
˙Selenium模組
˙XPath方法解說
˙css定位網頁元素
˙Cookie觀念
˙自動填寫表單
˙使用IP代理服務與實作
˙偵測IP
˙更進一步解說更新的模組Requests-HTML
˙認識適用大型爬蟲框架的Scrapy模組
本書沿襲作者著作的特色,程式實例豐富,相信讀者只要遵循本書內容必定可以在最短時間精通Python網路爬蟲設計。
推薦延伸閱讀
借過該書還借過哪些書?