Python網路爬蟲
大數據擷取、清洗、儲存與分析
王者歸來(第二版)
★★★本書第一版是【博客來2020年】【電腦書年度暢銷榜第3名】★★★
★★★★★【26個主題】+【400個實例】★★★★★
★★★★★從【零】開始的【網路爬蟲入門書籍】★★★★★
★★★★★大數據【擷取】、【清洗】、【儲存與分析】★★★★★
★★★★★【網路趨勢】+【了解輿情】★★★★★
第二版和第一版做比較,增加下列內容:
★:全書增加約50個程式實例
★:網路趨勢,了解輿情
★:網路關鍵字查詢
★:YouBike資訊
★:國際金融資料查詢
★:博客來圖書排行榜
★:中央氣象局
★:租屋網站
★:生活應用
下列是本書有關網路爬蟲知識的主要內容:
★:認識搜尋引擎與網路爬蟲
★:認識約定成俗的協議robots.txt ★:從零開始解析HTML網頁
★:認識與使用Chrome開發人員環境解析網頁
★:認識Python內建urllib、urllib2模組,同時介紹好用的requests模組
★:說明lxml模組
★:XPath方法解說
★:css定位網頁元素
★:Cookie觀念
★:自動填寫表單
★:使用IP代理服務與實作
★:偵測IP ★:更進一步解說更新的模組Requests-HTML ★:認識適用大型爬蟲框架的Scrapy模組
在書籍內容,筆者設計爬蟲程式探索下列相關網站:
☆:國際與國內股市資訊
☆:基金資訊
☆:股市數據
☆:人力銀行
☆:維基網站
☆:主流媒體網站
☆:政府開放數據網站
☆:YouBike服務網站
☆:PTT網站
☆:電影網站
☆:星座網站
☆:小說網站
☆:博客來網站
☆:中央氣象局
☆:露天拍賣網站
☆:httpbin網站
☆:python.org網站
☆:github.com網站
☆:ipstack.com網站API實作
☆:Google API實作
☆:Facebook API實作
探索網站成功後,筆者也說明下列如何下載或儲存不同資料格式的數據:
★:CSV檔案格式
★:JSON檔案格式
★:XML、Pickle ★:Excel ★:SQLite 在設計爬蟲階段我們可能會碰上一些技術問題,筆者也以實例解決下列相關問題:
☆:URL編碼與中文網址觀念
☆:將中文儲存
►►►重量級Claude Code手冊◄◄◄ ►►►涵蓋最新更新Agent Skills內容◄◄◄ ►►►從新手晉升為高手◄◄◄ ★內容介紹 ☆Vibe Coding 時代第一名的 AI 開發助手 Claude ...
https://youtu.be/aCXqTqqQzVY Gemini 3 x NotebookLM 領軍 Nano Banana Pro x Veo x Whisk x Flow x Gem Google 多模態 AI 工作流 本書內容 ☆★☆從 Gemini...
AI高效學習術 人工智慧時代學得更聰明 本書內容 ☆★☆在 AI 時代,會學習才是真本事☆★☆ ☆★☆不是學更多,而是學得更聰明☆★☆ ☆★☆讓 AI 當思考教練,而不是...
★ 第一本 Google Antigravity 繁體中文完整教學 ★ AI 原生開發環境的核心概念與實戰技巧 ★ Agent 架構:理解 AI 代理人如何替你寫程式、做決策 ★ 多 Agent...
這不是一本鉅細靡遺的 C# 語法字典。 本書將介紹 C# 語言當中較為核心、進階、或需要花較多時間深度理解的部分。不同於傳統程式設計書籍的是,本書特別強調...
NotebookLM筆記術 打造你的AI「第二大腦」 ★☆★ 從「抄重點」走向「理解與輸出」 ★☆★ ★☆★ 多來源整合 x 提問思考 x 知識累積 ★☆★ ★☆★ 學生、教師、上班...
還在為畫圖表浪費時間排版嗎?本書帶你進入「純文字畫圖」的高效境界!本書從零開始,帶你無痛建置開發環境,並熟練掌握基礎語法。只要敲敲鍵盤,就能瞬間生...
2025,Agent 元年。 AI 不再只是回答問題,而是真正幫你把事情做完。 這本書帶你認識這個即將改變工作與生活的新夥伴。
\\國內第一本!OpenClaw實戰專書 // AI 助理不只住在手機裡。OpenClaw 是第一個真正能「坐在你電腦前幫你做事」的開源 Computer Agent,從開啟軟體、填...
這是一本完全入門,充滿創意與描述Python未來潛在應用的書籍,也是國內第一本: ☆ 「與 AI 對話」單元:引導讀者用ChatGPT對Python語法進行深度理解...
C# 最強入門 邁向頂尖高手之路 王者歸來 ★★★★★【國內第1本最新 C# 語法】★★★★★ ★★★★★【最完整的 C# 基礎語法】、【最徹底物件導向觀念】★★★★★ ★★★★★...
★★★★★【內容最紮實、應用最廣】【40個主題】★★★★★ ★★★★★【程式實例最多】【約1280個Python實例】★★★★★ ★★★★★【18大類Python潛在應用】★★★★★ ★★★★★【400個...
用 PyTorch、NumPy、Google Colab T4 GPU 最強工具 完整實作 Perceptron、CNN、RNN、Transformer、GPT、RLHF 等經典論文
把你腦中的靈感發展成能通過市場考驗的遊戲 你所需要的遊戲製作知識全在這裡! 暢銷大作《戰神》、《小精靈世界》設計師心法傳授 手機遊戲已蔚為風...
https://youtu.be/1s9CaTmY4RM 機器學習 最強入門邁向AI高手 王者歸來(全彩印刷) 內容簡介 ★★★★★【數學原理 + 演算法 + 真實案例 + 專題實作】★★★★★ ...
寫程式不是比誰先跑起來,而是能否長期維護。當需求一改就骨牌倒、長函式與巢狀條件像毛線球、沒有測試誰也不敢動,這些都是「技術債」。本書以實務為軸,從C...
【本書內容】 ★☆★☆★【技術最強、功能最廣】★☆★☆★ ★☆★☆★【AI助力效率飛躍】★☆★☆★ ★☆★☆★【多執行緒設計效能提升】★☆★☆★
(本書持續校稿更新中,如有缺漏可以來信告知,我們會免費更新給您) AI浪潮下,自己有很多創意點子卻不知道如何實現嗎? 很討厭老闆、想要自己創業,卻苦無資...
Python網路爬蟲
大數據擷取、清洗、儲存與分析
王者歸來(第二版)
★★★本書第一版是【博客來2020年】【電腦書年度暢銷榜第3名】★★★
★★★★★【26個主題】+【400個實例】★★★★★
★★★★★從【零】開始的【網路爬蟲入門書籍】★★★★★
★★★★★大數據【擷取】、【清洗】、【儲存與分析】★★★★★
★★★★★【網路趨勢】+【了解輿情】★★★★★
第二版和第一版做比較,增加下列內容:
★:全書增加約50個程式實例
★:網路趨勢,了解輿情
★:網路關鍵字查詢
★:YouBike資訊
★:國際金融資料查詢
★:博客來圖書排行榜
★:中央氣象局
★:租屋網站
★:生活應用
下列是本書有關網路爬蟲知識的主要內容:
★:認識搜尋引擎與網路爬蟲
★:認識約定成俗的協議robots.txt ★:從零開始解析HTML網頁
★:認識與使用Chrome開發人員環境解析網頁
★:認識Python內建urllib、urllib2模組,同時介紹好用的requests模組
★:說明lxml模組
★:XPath方法解說
★:css定位網頁元素
★:Cookie觀念
★:自動填寫表單
★:使用IP代理服務與實作
★:偵測IP ★:更進一步解說更新的模組Requests-HTML ★:認識適用大型爬蟲框架的Scrapy模組
在書籍內容,筆者設計爬蟲程式探索下列相關網站:
☆:國際與國內股市資訊
☆:基金資訊
☆:股市數據
☆:人力銀行
☆:維基網站
☆:主流媒體網站
☆:政府開放數據網站
☆:YouBike服務網站
☆:PTT網站
☆:電影網站
☆:星座網站
☆:小說網站
☆:博客來網站
☆:中央氣象局
☆:露天拍賣網站
☆:httpbin網站
☆:python.org網站
☆:github.com網站
☆:ipstack.com網站API實作
☆:Google API實作
☆:Facebook API實作
探索網站成功後,筆者也說明下列如何下載或儲存不同資料格式的數據:
★:CSV檔案格式
★:JSON檔案格式
★:XML、Pickle ★:Excel ★:SQLite 在設計爬蟲階段我們可能會碰上一些技術問題,筆者也以實例解決下列相關問題:
☆:URL編碼與中文網址觀念
☆:將中文儲存在JSON格式檔案
☆:亂碼處理
☆:簡體中文在繁體中文Windows環境資料下載與儲存
☆:解析Ajax動態加載網頁,獲得更多頁次資料
☆:使用Chromium瀏覽器協助Ajax動態加載
根據台灣現行法規,數位內容( 如電子書、音樂、影片、遊戲、App )形式之商品,不受「網購服務需提供七日鑑賞期」的限制。為維護您的權益,建議您先使用「試讀」功能後再付款購買。