Python網路爬蟲:大數據擷取、清洗、儲存與分析-王者歸來
0 則劃線
0 篇書評

Python網路爬蟲:大數據擷取、清洗、儲存與分析-王者歸來

  • 出版日期: 2021/10/01
  • 語言:繁體中文
  • 檔案大小:107.8MB
  • 商品格式:固定版面 EPUB
  • ISBN: 9789860776492
  • ISBN: 9789860776478
  • 頁數: 554
紙本書定價:NT$ 750
電子書售價:NT$ 600
本書為固定版面 EPUB,建議您使用 mooInk Pro 系列、平板及電腦閱讀。

Python網路爬蟲
大數據擷取、清洗、儲存與分析
王者歸來(第二版)
★★★本書第一版是【博客來2020年】【電腦書年度暢銷榜第3名】★★★
★★★★★【26個主題】+【400個實例】★★★★★
★★★★★從【零】開始的【網路爬蟲入門書籍】★★★★★
★★★★★大數據【擷取】、【清洗】、【儲存與分析】★★★★★
★★★★★【網路趨勢】+【了解輿情】★★★★★
第二版和第一版做比較,增加下列內容:
★:全書增加約50個程式實例
★:網路趨勢,了解輿情
★:網路關鍵字查詢
★:YouBike資訊
★:國際金融資料查詢
★:博客來圖書排行榜
★:中央氣象局
★:租屋網站
★:生活應用
下列是本書有關網路爬蟲知識的主要內容:
★:認識搜尋引擎與網路爬蟲
★:認識約定成俗的協議robots.txt ★:從零開始解析HTML網頁
★:認識與使用Chrome開發人員環境解析網頁
★:認識Python內建urllib、urllib2模組,同時介紹好用的requests模組
★:說明lxml模組
★:XPath方法解說
★:css定位網頁元素
★:Cookie觀念
★:自動填寫表單
★:使用IP代理服務與實作
★:偵測IP ★:更進一步解說更新的模組Requests-HTML ★:認識適用大型爬蟲框架的Scrapy模組
在書籍內容,筆者設計爬蟲程式探索下列相關網站:
☆:國際與國內股市資訊
☆:基金資訊
☆:股市數據
☆:人力銀行
☆:維基網站
☆:主流媒體網站
☆:政府開放數據網站
☆:YouBike服務網站
☆:PTT網站
☆:電影網站
☆:星座網站
☆:小說網站
☆:博客來網站
☆:中央氣象局
☆:露天拍賣網站
☆:httpbin網站
☆:python.org網站
☆:github.com網站
☆:ipstack.com網站API實作
☆:Google API實作
☆:Facebook API實作
探索網站成功後,筆者也說明下列如何下載或儲存不同資料格式的數據:
★:CSV檔案格式
★:JSON檔案格式
★:XML、Pickle ★:Excel ★:SQLite 在設計爬蟲階段我們可能會碰上一些技術問題,筆者也以實例解決下列相關問題:
☆:URL編碼與中文網址觀念
☆:將中文儲存

喜歡這本的人,也看了...

  • 電子書: NT$ 864

    ►►►重量級Claude Code手冊◄◄◄ ►►►涵蓋最新更新Agent Skills內容◄◄◄ ►►►從新手晉升為高手◄◄◄ ★內容介紹 ☆Vibe Coding 時代第一名的 AI 開發助手 Claude ...

  • 電子書: NT$ 520

    https://youtu.be/aCXqTqqQzVY Gemini 3 x NotebookLM 領軍 Nano Banana Pro x Veo x Whisk x Flow x Gem Google 多模態 AI 工作流 本書內容 ☆★☆從 Gemini...

  • 電子書: NT$ 480

    AI高效學習術 人工智慧時代學得更聰明 本書內容 ☆★☆在 AI 時代,會學習才是真本事☆★☆ ☆★☆不是學更多,而是學得更聰明☆★☆ ☆★☆讓 AI 當思考教練,而不是...

  • 電子書: NT$ 784

    ★ 第一本 Google Antigravity 繁體中文完整教學 ★ AI 原生開發環境的核心概念與實戰技巧 ★ Agent 架構:理解 AI 代理人如何替你寫程式、做決策 ★ 多 Agent...

  • 電子書: NT$ 390

    這不是一本鉅細靡遺的 C# 語法字典。 本書將介紹 C# 語言當中較為核心、進階、或需要花較多時間深度理解的部分。不同於傳統程式設計書籍的是,本書特別強調...

  • 電子書: NT$ 496

    NotebookLM筆記術 打造你的AI「第二大腦」 ★☆★ 從「抄重點」走向「理解與輸出」 ★☆★ ★☆★ 多來源整合 x 提問思考 x 知識累積 ★☆★ ★☆★ 學生、教師、上班...

  • 電子書: NT$ 704

    還在為畫圖表浪費時間排版嗎?本書帶你進入「純文字畫圖」的高效境界!本書從零開始,帶你無痛建置開發環境,並熟練掌握基礎語法。只要敲敲鍵盤,就能瞬間生...

  • 電子書: NT$ 608

    2025,Agent 元年。 AI 不再只是回答問題,而是真正幫你把事情做完。 這本書帶你認識這個即將改變工作與生活的新夥伴。

  • 電子書: NT$ 704

    \\國內第一本!OpenClaw實戰專書 // AI 助理不只住在手機裡。OpenClaw 是第一個真正能「坐在你電腦前幫你做事」的開源 Computer Agent,從開啟軟體、填...

  • 電子書: NT$ 544

      這是一本完全入門,充滿創意與描述Python未來潛在應用的書籍,也是國內第一本:   ☆ 「與 AI 對話」單元:引導讀者用ChatGPT對Python語法進行深度理解...

  • 出版日期:2023-02-01
    電子書: NT$ 784

    C# 最強入門 邁向頂尖高手之路 王者歸來 ★★★★★【國內第1本最新 C# 語法】★★★★★ ★★★★★【最完整的 C# 基礎語法】、【最徹底物件導向觀念】★★★★★ ★★★★★...

  • 電子書: NT$ 960

    ★★★★★【內容最紮實、應用最廣】【40個主題】★★★★★ ★★★★★【程式實例最多】【約1280個Python實例】★★★★★ ★★★★★【18大類Python潛在應用】★★★★★ ★★★★★【400個...

  • 電子書: NT$ 864

    用 PyTorch、NumPy、Google Colab T4 GPU 最強工具 完整實作 Perceptron、CNN、RNN、Transformer、GPT、RLHF 等經典論文

  • 電子書: NT$ 655

    把你腦中的靈感發展成能通過市場考驗的遊戲 你所需要的遊戲製作知識全在這裡! 暢銷大作《戰神》、《小精靈世界》設計師心法傳授   手機遊戲已蔚為風...

  • 電子書: NT$ 864

    https://youtu.be/1s9CaTmY4RM 機器學習 最強入門邁向AI高手 王者歸來(全彩印刷) 內容簡介 ★★★★★【數學原理 + 演算法 + 真實案例 + 專題實作】★★★★★ ...

  • 電子書: NT$ 576

    寫程式不是比誰先跑起來,而是能否長期維護。當需求一改就骨牌倒、長函式與巢狀條件像毛線球、沒有測試誰也不敢動,這些都是「技術債」。本書以實務為軸,從C...

  • 電子書: NT$ 704

    【本書內容】 ★☆★☆★【技術最強、功能最廣】★☆★☆★ ★☆★☆★【AI助力效率飛躍】★☆★☆★ ★☆★☆★【多執行緒設計效能提升】★☆★☆★

  • 電子書: NT$ 150

    (本書持續校稿更新中,如有缺漏可以來信告知,我們會免費更新給您) AI浪潮下,自己有很多創意點子卻不知道如何實現嗎? 很討厭老闆、想要自己創業,卻苦無資...

  • 詳細資訊

    Python網路爬蟲
    大數據擷取、清洗、儲存與分析
    王者歸來(第二版)
    ★★★本書第一版是【博客來2020年】【電腦書年度暢銷榜第3名】★★★
    ★★★★★【26個主題】+【400個實例】★★★★★
    ★★★★★從【零】開始的【網路爬蟲入門書籍】★★★★★
    ★★★★★大數據【擷取】、【清洗】、【儲存與分析】★★★★★
    ★★★★★【網路趨勢】+【了解輿情】★★★★★
    第二版和第一版做比較,增加下列內容:
    ★:全書增加約50個程式實例
    ★:網路趨勢,了解輿情
    ★:網路關鍵字查詢
    ★:YouBike資訊
    ★:國際金融資料查詢
    ★:博客來圖書排行榜
    ★:中央氣象局
    ★:租屋網站
    ★:生活應用
    下列是本書有關網路爬蟲知識的主要內容:
    ★:認識搜尋引擎與網路爬蟲
    ★:認識約定成俗的協議robots.txt ★:從零開始解析HTML網頁
    ★:認識與使用Chrome開發人員環境解析網頁
    ★:認識Python內建urllib、urllib2模組,同時介紹好用的requests模組
    ★:說明lxml模組
    ★:XPath方法解說
    ★:css定位網頁元素
    ★:Cookie觀念
    ★:自動填寫表單
    ★:使用IP代理服務與實作
    ★:偵測IP ★:更進一步解說更新的模組Requests-HTML ★:認識適用大型爬蟲框架的Scrapy模組
    在書籍內容,筆者設計爬蟲程式探索下列相關網站:
    ☆:國際與國內股市資訊
    ☆:基金資訊
    ☆:股市數據
    ☆:人力銀行
    ☆:維基網站
    ☆:主流媒體網站
    ☆:政府開放數據網站
    ☆:YouBike服務網站
    ☆:PTT網站
    ☆:電影網站
    ☆:星座網站
    ☆:小說網站
    ☆:博客來網站
    ☆:中央氣象局
    ☆:露天拍賣網站
    ☆:httpbin網站
    ☆:python.org網站
    ☆:github.com網站
    ☆:ipstack.com網站API實作
    ☆:Google API實作
    ☆:Facebook API實作
    探索網站成功後,筆者也說明下列如何下載或儲存不同資料格式的數據:
    ★:CSV檔案格式
    ★:JSON檔案格式
    ★:XML、Pickle ★:Excel ★:SQLite 在設計爬蟲階段我們可能會碰上一些技術問題,筆者也以實例解決下列相關問題:
    ☆:URL編碼與中文網址觀念
    ☆:將中文儲存在JSON格式檔案
    ☆:亂碼處理
    ☆:簡體中文在繁體中文Windows環境資料下載與儲存
    ☆:解析Ajax動態加載網頁,獲得更多頁次資料
    ☆:使用Chromium瀏覽器協助Ajax動態加載

    目錄列表

    購買說明

    根據台灣現行法規,數位內容( 如電子書、音樂、影片、遊戲、App )形式之商品,不受「網購服務需提供七日鑑賞期」的限制。為維護您的權益,建議您先使用「試讀」功能後再付款購買。

    試讀