Python網路爬蟲:大數據擷取、清洗、儲存與分析-王者歸來
0 則劃線
0 篇書評

Python網路爬蟲:大數據擷取、清洗、儲存與分析-王者歸來

  • 出版日期: 2021/10/01
  • 語言:繁體中文
  • 檔案大小:107.8MB
  • 商品格式:固定版面 EPUB
  • ISBN: 9789860776492
  • ISBN: 9789860776478
  • 頁數: 554
紙本書定價:NT$ 750
電子書售價:NT$ 600
本書為固定版面 EPUB,建議您使用 mooInk Pro 系列、平板及電腦閱讀。

Python網路爬蟲
大數據擷取、清洗、儲存與分析
王者歸來(第二版)
★★★本書第一版是【博客來2020年】【電腦書年度暢銷榜第3名】★★★
★★★★★【26個主題】+【400個實例】★★★★★
★★★★★從【零】開始的【網路爬蟲入門書籍】★★★★★
★★★★★大數據【擷取】、【清洗】、【儲存與分析】★★★★★
★★★★★【網路趨勢】+【了解輿情】★★★★★
第二版和第一版做比較,增加下列內容:
★:全書增加約50個程式實例
★:網路趨勢,了解輿情
★:網路關鍵字查詢
★:YouBike資訊
★:國際金融資料查詢
★:博客來圖書排行榜
★:中央氣象局
★:租屋網站
★:生活應用
下列是本書有關網路爬蟲知識的主要內容:
★:認識搜尋引擎與網路爬蟲
★:認識約定成俗的協議robots.txt ★:從零開始解析HTML網頁
★:認識與使用Chrome開發人員環境解析網頁
★:認識Python內建urllib、urllib2模組,同時介紹好用的requests模組
★:說明lxml模組
★:XPath方法解說
★:css定位網頁元素
★:Cookie觀念
★:自動填寫表單
★:使用IP代理服務與實作
★:偵測IP ★:更進一步解說更新的模組Requests-HTML ★:認識適用大型爬蟲框架的Scrapy模組
在書籍內容,筆者設計爬蟲程式探索下列相關網站:
☆:國際與國內股市資訊
☆:基金資訊
☆:股市數據
☆:人力銀行
☆:維基網站
☆:主流媒體網站
☆:政府開放數據網站
☆:YouBike服務網站
☆:PTT網站
☆:電影網站
☆:星座網站
☆:小說網站
☆:博客來網站
☆:中央氣象局
☆:露天拍賣網站
☆:httpbin網站
☆:python.org網站
☆:github.com網站
☆:ipstack.com網站API實作
☆:Google API實作
☆:Facebook API實作
探索網站成功後,筆者也說明下列如何下載或儲存不同資料格式的數據:
★:CSV檔案格式
★:JSON檔案格式
★:XML、Pickle ★:Excel ★:SQLite 在設計爬蟲階段我們可能會碰上一些技術問題,筆者也以實例解決下列相關問題:
☆:URL編碼與中文網址觀念
☆:將中文儲存

喜歡這本的人,也看了...

  • 電子書: NT$ 520

    https://youtu.be/aCXqTqqQzVY Gemini 3 x NotebookLM 領軍 Nano Banana Pro x Veo x Whisk x Flow x Gem Google 多模態 AI 工作流 本書內容 ☆★☆從 Gemini...

  • 電子書: NT$ 864

    ►►►重量級Claude Code手冊◄◄◄ ►►►涵蓋最新更新Agent Skills內容◄◄◄ ►►►從新手晉升為高手◄◄◄ ★內容介紹 ☆Vibe Coding 時代第一名的 AI 開發助手 Claude ...

  • 電子書: NT$ 576

    "★★★「程式設計不再孤軍奮戰,讓 AI 成為你的戰友!」★★★ ☆☆☆「用 VS Code + Copilot,讓寫程式變得像聊天一樣簡單!」☆☆☆ ★★★「專案實戰,立即上手,程式...

  • 電子書: NT$ 496

    ☆★☆從 Gemini 到 NotebookLM,打造個人知識與創作☆★☆ ☆★☆整合 Google Workspace全系列 AI 工具☆★☆ ☆★☆圖像、語音、影片與文件的多模態☆★☆ ☆★☆讓 AI 真的成...

  • 電子書: NT$ 704

    https://youtu.be/Jqv2QYNff-4 \\國內第一本!Cursor教戰手冊// ☆★☆Context Engineering 頂級實作工具☆★☆ ☆★☆100倍速開發,一天完成原型及產品佈署☆★☆

  • 電子書: NT$ 440

    這不是一本鉅細靡遺的 C# 語法字典。 本書將介紹 C# 語言當中較為核心、進階、或需要花較多時間深度理解的部分。不同於傳統程式設計書籍的是,本書特別強調...

  • 電子書: NT$ 496

    市面上第一本結合「八字命盤、AI 覺察與人生指引信」的自我探索說明書。 寫給站在人生岔路前、猶豫著該往哪裡走的你, 寫給忙得不敢停下、只能硬撐著往前走的...

  • 電子書: NT$ 464

    為什麼這本《AI 思維 - 原子習慣》值得你帶回家? 如果你已經看過無數「自律」、「時間管理」、「成功習慣」的書,卻始終做不到、撐不久、三分鐘熱度,那不...

  • 電子書: NT$ 496

    NotebookLM筆記術 打造你的AI「第二大腦」 ★☆★ 從「抄重點」走向「理解與輸出」 ★☆★ ★☆★ 多來源整合 x 提問思考 x 知識累積 ★☆★ ★☆★ 學生、教師、上班...

  • 電子書: NT$ 544

    ★☆★「AI 時代最全面的 ChatGPT 5 實戰指南」★☆★ 在 AI 快速演進的浪潮中,ChatGPT 5 不僅是工具,更是未來工作與創作的強大戰友。本書從基礎到進階,完整揭...

  • 電子書: NT$ 464

    AI提示詞 打造精準Prompt的對話力與創造力 【台灣首創Prompt教戰守則】 【解密AI對話的黃金鑰匙】 【實戰範例,學Prompt超有感】 【職場創新,掌握AI...

  • 出版日期:2021-02-07
    電子書: NT$ 450

    從零開始!快速上手!網羅完整Vue.js功能的實戰指南

  • 電子書: NT$ 656

    你與 AI 大神的距離,只差這本「動手做」的實戰指南! 翻開本書,開始打造專屬於你的第一個 AI 應用吧! ★ AI 當你的程式助教,從零開始不怕痛! 本書專...

  • 電子書: NT$ 704

    【本書內容】 ★☆★☆★【技術最強、功能最廣】★☆★☆★ ★☆★☆★【AI助力效率飛躍】★☆★☆★ ★☆★☆★【多執行緒設計效能提升】★☆★☆★

  • 電子書: NT$ 632

    ★★★《AWS自學聖經》作者Sam T.全新作★★★ ★★★圖解教學★★★ ✦什麼是K8S? K8S全名為Kubernetes,是一套容器化管理框架,常與Docker等技術一起運用。近年來...

  • 電子書: NT$ 608

    這不是一本給初學者的JavaScript教科書。相反地,它是寫給那些已經學過JavaScript卻依然感到卡關,對某些觀念依然模糊的開發者。 就像大學課程一樣,或許都是...

  • 電子書: NT$ 474

    軟體開發本身有著本質上的問題及困難,軟體工程各種工程層面及管理層面中涉及的技術,便是為了逐步克服與減緩這些軟體與生俱來的複雜性、易變性、隱藏性及一...

  • 出版日期:2024-12-22
    電子書: NT$ 720

    本書內容改編自第 15 屆 iThome 鐵人賽 Mobile Development 組佳作系列文章《探索 Flutter 由裡到外,三十天帶你前往進階》與Mobile Development 組優選系列...

  • 詳細資訊

    Python網路爬蟲
    大數據擷取、清洗、儲存與分析
    王者歸來(第二版)
    ★★★本書第一版是【博客來2020年】【電腦書年度暢銷榜第3名】★★★
    ★★★★★【26個主題】+【400個實例】★★★★★
    ★★★★★從【零】開始的【網路爬蟲入門書籍】★★★★★
    ★★★★★大數據【擷取】、【清洗】、【儲存與分析】★★★★★
    ★★★★★【網路趨勢】+【了解輿情】★★★★★
    第二版和第一版做比較,增加下列內容:
    ★:全書增加約50個程式實例
    ★:網路趨勢,了解輿情
    ★:網路關鍵字查詢
    ★:YouBike資訊
    ★:國際金融資料查詢
    ★:博客來圖書排行榜
    ★:中央氣象局
    ★:租屋網站
    ★:生活應用
    下列是本書有關網路爬蟲知識的主要內容:
    ★:認識搜尋引擎與網路爬蟲
    ★:認識約定成俗的協議robots.txt ★:從零開始解析HTML網頁
    ★:認識與使用Chrome開發人員環境解析網頁
    ★:認識Python內建urllib、urllib2模組,同時介紹好用的requests模組
    ★:說明lxml模組
    ★:XPath方法解說
    ★:css定位網頁元素
    ★:Cookie觀念
    ★:自動填寫表單
    ★:使用IP代理服務與實作
    ★:偵測IP ★:更進一步解說更新的模組Requests-HTML ★:認識適用大型爬蟲框架的Scrapy模組
    在書籍內容,筆者設計爬蟲程式探索下列相關網站:
    ☆:國際與國內股市資訊
    ☆:基金資訊
    ☆:股市數據
    ☆:人力銀行
    ☆:維基網站
    ☆:主流媒體網站
    ☆:政府開放數據網站
    ☆:YouBike服務網站
    ☆:PTT網站
    ☆:電影網站
    ☆:星座網站
    ☆:小說網站
    ☆:博客來網站
    ☆:中央氣象局
    ☆:露天拍賣網站
    ☆:httpbin網站
    ☆:python.org網站
    ☆:github.com網站
    ☆:ipstack.com網站API實作
    ☆:Google API實作
    ☆:Facebook API實作
    探索網站成功後,筆者也說明下列如何下載或儲存不同資料格式的數據:
    ★:CSV檔案格式
    ★:JSON檔案格式
    ★:XML、Pickle ★:Excel ★:SQLite 在設計爬蟲階段我們可能會碰上一些技術問題,筆者也以實例解決下列相關問題:
    ☆:URL編碼與中文網址觀念
    ☆:將中文儲存在JSON格式檔案
    ☆:亂碼處理
    ☆:簡體中文在繁體中文Windows環境資料下載與儲存
    ☆:解析Ajax動態加載網頁,獲得更多頁次資料
    ☆:使用Chromium瀏覽器協助Ajax動態加載

    目錄列表

    購買說明

    根據台灣現行法規,數位內容( 如電子書、音樂、影片、遊戲、App )形式之商品,不受「網購服務需提供七日鑑賞期」的限制。為維護您的權益,建議您先使用「試讀」功能後再付款購買。

    試讀