Python網路爬蟲
大數據擷取、清洗、儲存與分析
王者歸來(第二版)
★★★本書第一版是【博客來2020年】【電腦書年度暢銷榜第3名】★★★
★★★★★【26個主題】+【400個實例】★★★★★
★★★★★從【零】開始的【網路爬蟲入門書籍】★★★★★
★★★★★大數據【擷取】、【清洗】、【儲存與分析】★★★★★
★★★★★【網路趨勢】+【了解輿情】★★★★★
第二版和第一版做比較,增加下列內容:
★:全書增加約50個程式實例
★:網路趨勢,了解輿情
★:網路關鍵字查詢
★:YouBike資訊
★:國際金融資料查詢
★:博客來圖書排行榜
★:中央氣象局
★:租屋網站
★:生活應用
下列是本書有關網路爬蟲知識的主要內容:
★:認識搜尋引擎與網路爬蟲
★:認識約定成俗的協議robots.txt ★:從零開始解析HTML網頁
★:認識與使用Chrome開發人員環境解析網頁
★:認識Python內建urllib、urllib2模組,同時介紹好用的requests模組
★:說明lxml模組
★:XPath方法解說
★:css定位網頁元素
★:Cookie觀念
★:自動填寫表單
★:使用IP代理服務與實作
★:偵測IP ★:更進一步解說更新的模組Requests-HTML ★:認識適用大型爬蟲框架的Scrapy模組
在書籍內容,筆者設計爬蟲程式探索下列相關網站:
☆:國際與國內股市資訊
☆:基金資訊
☆:股市數據
☆:人力銀行
☆:維基網站
☆:主流媒體網站
☆:政府開放數據網站
☆:YouBike服務網站
☆:PTT網站
☆:電影網站
☆:星座網站
☆:小說網站
☆:博客來網站
☆:中央氣象局
☆:露天拍賣網站
☆:httpbin網站
☆:python.org網站
☆:github.com網站
☆:ipstack.com網站API實作
☆:Google API實作
☆:Facebook API實作
探索網站成功後,筆者也說明下列如何下載或儲存不同資料格式的數據:
★:CSV檔案格式
★:JSON檔案格式
★:XML、Pickle ★:Excel ★:SQLite 在設計爬蟲階段我們可能會碰上一些技術問題,筆者也以實例解決下列相關問題:
☆:URL編碼與中文網址觀念
☆:將中文儲存
https://youtu.be/aCXqTqqQzVY Gemini 3 x NotebookLM 領軍 Nano Banana Pro x Veo x Whisk x Flow x Gem Google 多模態 AI 工作流 本書內容 ☆★☆從 Gemini...
►►►重量級Claude Code手冊◄◄◄ ►►►涵蓋最新更新Agent Skills內容◄◄◄ ►►►從新手晉升為高手◄◄◄ ★內容介紹 ☆Vibe Coding 時代第一名的 AI 開發助手 Claude ...
"★★★「程式設計不再孤軍奮戰,讓 AI 成為你的戰友!」★★★ ☆☆☆「用 VS Code + Copilot,讓寫程式變得像聊天一樣簡單!」☆☆☆ ★★★「專案實戰,立即上手,程式...
☆★☆從 Gemini 到 NotebookLM,打造個人知識與創作☆★☆ ☆★☆整合 Google Workspace全系列 AI 工具☆★☆ ☆★☆圖像、語音、影片與文件的多模態☆★☆ ☆★☆讓 AI 真的成...
https://youtu.be/Jqv2QYNff-4 \\國內第一本!Cursor教戰手冊// ☆★☆Context Engineering 頂級實作工具☆★☆ ☆★☆100倍速開發,一天完成原型及產品佈署☆★☆
這不是一本鉅細靡遺的 C# 語法字典。 本書將介紹 C# 語言當中較為核心、進階、或需要花較多時間深度理解的部分。不同於傳統程式設計書籍的是,本書特別強調...
市面上第一本結合「八字命盤、AI 覺察與人生指引信」的自我探索說明書。 寫給站在人生岔路前、猶豫著該往哪裡走的你, 寫給忙得不敢停下、只能硬撐著往前走的...
為什麼這本《AI 思維 - 原子習慣》值得你帶回家? 如果你已經看過無數「自律」、「時間管理」、「成功習慣」的書,卻始終做不到、撐不久、三分鐘熱度,那不...
NotebookLM筆記術 打造你的AI「第二大腦」 ★☆★ 從「抄重點」走向「理解與輸出」 ★☆★ ★☆★ 多來源整合 x 提問思考 x 知識累積 ★☆★ ★☆★ 學生、教師、上班...
★☆★「AI 時代最全面的 ChatGPT 5 實戰指南」★☆★ 在 AI 快速演進的浪潮中,ChatGPT 5 不僅是工具,更是未來工作與創作的強大戰友。本書從基礎到進階,完整揭...
AI提示詞 打造精準Prompt的對話力與創造力 【台灣首創Prompt教戰守則】 【解密AI對話的黃金鑰匙】 【實戰範例,學Prompt超有感】 【職場創新,掌握AI...
你與 AI 大神的距離,只差這本「動手做」的實戰指南! 翻開本書,開始打造專屬於你的第一個 AI 應用吧! ★ AI 當你的程式助教,從零開始不怕痛! 本書專...
【本書內容】 ★☆★☆★【技術最強、功能最廣】★☆★☆★ ★☆★☆★【AI助力效率飛躍】★☆★☆★ ★☆★☆★【多執行緒設計效能提升】★☆★☆★
★★★《AWS自學聖經》作者Sam T.全新作★★★ ★★★圖解教學★★★ ✦什麼是K8S? K8S全名為Kubernetes,是一套容器化管理框架,常與Docker等技術一起運用。近年來...
這不是一本給初學者的JavaScript教科書。相反地,它是寫給那些已經學過JavaScript卻依然感到卡關,對某些觀念依然模糊的開發者。 就像大學課程一樣,或許都是...
本書內容改編自第 15 屆 iThome 鐵人賽 Mobile Development 組佳作系列文章《探索 Flutter 由裡到外,三十天帶你前往進階》與Mobile Development 組優選系列...
Python網路爬蟲
大數據擷取、清洗、儲存與分析
王者歸來(第二版)
★★★本書第一版是【博客來2020年】【電腦書年度暢銷榜第3名】★★★
★★★★★【26個主題】+【400個實例】★★★★★
★★★★★從【零】開始的【網路爬蟲入門書籍】★★★★★
★★★★★大數據【擷取】、【清洗】、【儲存與分析】★★★★★
★★★★★【網路趨勢】+【了解輿情】★★★★★
第二版和第一版做比較,增加下列內容:
★:全書增加約50個程式實例
★:網路趨勢,了解輿情
★:網路關鍵字查詢
★:YouBike資訊
★:國際金融資料查詢
★:博客來圖書排行榜
★:中央氣象局
★:租屋網站
★:生活應用
下列是本書有關網路爬蟲知識的主要內容:
★:認識搜尋引擎與網路爬蟲
★:認識約定成俗的協議robots.txt ★:從零開始解析HTML網頁
★:認識與使用Chrome開發人員環境解析網頁
★:認識Python內建urllib、urllib2模組,同時介紹好用的requests模組
★:說明lxml模組
★:XPath方法解說
★:css定位網頁元素
★:Cookie觀念
★:自動填寫表單
★:使用IP代理服務與實作
★:偵測IP ★:更進一步解說更新的模組Requests-HTML ★:認識適用大型爬蟲框架的Scrapy模組
在書籍內容,筆者設計爬蟲程式探索下列相關網站:
☆:國際與國內股市資訊
☆:基金資訊
☆:股市數據
☆:人力銀行
☆:維基網站
☆:主流媒體網站
☆:政府開放數據網站
☆:YouBike服務網站
☆:PTT網站
☆:電影網站
☆:星座網站
☆:小說網站
☆:博客來網站
☆:中央氣象局
☆:露天拍賣網站
☆:httpbin網站
☆:python.org網站
☆:github.com網站
☆:ipstack.com網站API實作
☆:Google API實作
☆:Facebook API實作
探索網站成功後,筆者也說明下列如何下載或儲存不同資料格式的數據:
★:CSV檔案格式
★:JSON檔案格式
★:XML、Pickle ★:Excel ★:SQLite 在設計爬蟲階段我們可能會碰上一些技術問題,筆者也以實例解決下列相關問題:
☆:URL編碼與中文網址觀念
☆:將中文儲存在JSON格式檔案
☆:亂碼處理
☆:簡體中文在繁體中文Windows環境資料下載與儲存
☆:解析Ajax動態加載網頁,獲得更多頁次資料
☆:使用Chromium瀏覽器協助Ajax動態加載
根據台灣現行法規,數位內容( 如電子書、音樂、影片、遊戲、App )形式之商品,不受「網購服務需提供七日鑑賞期」的限制。為維護您的權益,建議您先使用「試讀」功能後再付款購買。