python3爬虫数据清洗与可视化实战pdf百度云_Python 3爬虫、数据清洗与可视化实战_PDF电子书...
因資源下載地址容易失效,請加微信號359049049直接領取,直接發最新下載地址。
前言
==============================================================
Python 是軍刀型的開源工具,被廣泛應用于 Web 開發、爬蟲、數據清洗、自然語言處理、機器學習和人工智能等方面,而且 Python 的語法簡潔易讀,這讓許多編程入門者不再望而卻步,因此Python 在最近幾年非常受歡迎,各行各業的技術人員都開始使用 Python。
本書內容來自筆者在高校授課的內容,主要介紹如何運用 Python 工具獲取電商平臺的頁面數據,并對數據進行清洗和存儲。本書簡化了 Python 基礎部分,保證有足夠的篇幅來介紹爬蟲和數據清洗的內容。
本書采用的版本是 Python 3.6.2,是筆者寫書時的最新版本,而且筆者習慣用的操作平臺是Windows 系統。雖然目前一些高校和開發者在使用 Python 2.7,但是 Python 團隊將在 2020 年停止對Python 2.7 的支持更新, Python 2.X 轉向 Python 3.X 是大勢所趨。
本書第 1 章簡單介紹 Python 和相關的 IDE,如果讀者完全沒有 Python 基礎,那么建議選購一本基礎書作為輔助。第 2~6 章介紹爬蟲的實例,實現從最簡單的爬蟲到相對比較復雜的爬蟲。鑒于實例的限制,本書的爬蟲內容沒有涉及代理服務器和驗證碼處理等問題。第 7 章介紹在 Python 中如何連接并操作數據庫。第 8 章介紹了 NumPy 及其用法。第 9 章詳細介紹 pandas 的功能,pandas 是 Python數據清洗和建模中非常重要的庫。第 10 章用兩個完整案例展示了從爬蟲到建模的過程。第 11 章介紹 Python 的可視化,選用的庫是 matplotlib 和 pyecharts,這里詳細介紹了 pyecharts。
鑒于作者的水平有限,不足之處請讀者不吝指教。
目錄
==============================================================
作者介紹
前言
第1章 Python 基礎
1.1 安裝 Python 環境
1.1.1 Python 3.6.2 安裝與配置
1.1.2 使用 IDE 工具——PyCharm
1.1.3 使用 IDE 工具——Anaconda
1.2 Python 操作入門
1.2.1 編寫第一個 Python 代碼
1.2.2 Python 基本操作
1.2.3 變量
1.3 Python數據類型
1.3.1 數字
1.3.2 字符串
1.3.3 列表
1.3.4 元組
1.3.5 集合
1.3.6 字典
1.4 Python 語句與函數
1.4.1 條件語句
1.4.2 循環語句
1.4.3 函數
第2章 寫一個簡單的爬蟲
2.1 關于爬蟲的合法性
2.2 了解網頁
2.2.1 認識網頁結構
2.2.2 寫一個簡單的 HTML
2.3 使用 requests 庫請求網站
2.3.1 安裝 requests 庫
2.3.2 爬蟲的基本原理
2.3.3 使用 GET 方式抓取數據
2.3.4 使用 POST 方式抓取數據
2.4 使用 Beautiful Soup 解析網頁
2.5 清洗和組織數據
2.6 爬蟲攻防戰
第3章 用 API 爬取天氣預報數據
3.1 注冊免費 API 和閱讀技術文檔
3.2 獲取 API 數據
3.3 存儲數據到 MongoDB
3.3.1 下載并安裝 MongoDB
3.3.2 在 PyCharm 中安裝 Mongo Plugin
3.3.3 將數據存入 MongoDB
3.4 MongoDB 數據庫查詢
第4章 大型爬蟲案例:抓取某電商網站的商品數據
4.1 觀察頁面特征和解析數據
4.2 工作流程分析
4.3 構建類目樹
4.4 獲取產品列表
4.5 代碼優化
4.6 爬蟲效率優化
4.7 容錯處理
第5章 Scrapy 爬蟲
5.1 Scrapy 簡介
5.2 Scrapy 安裝
5.3 案例:用 Scrapy 抓取股票行情
第6章 Selenium 爬蟲
6.1 Selenium 簡介
6.2 案例:用 Selenium 抓取電商網站數據
第7 章數據庫連接和查詢
7.1 使用 PyMySQL
7.1.1 連接數據庫
7.1.2 案例:某電商網站女裝行業 TOP100 銷量數據
7.2 使用 SQLAlchemy
7.2.1 SQLAlchemy 基本介紹
7.2.2 SQLAlchemy 基本語法
7.3 MongoDB
7.3.1 MongoDB 基本語法
7.3.2 案例:在某電商網站搜索“連衣裙”的商品數據
第8章 NumPy
8.1 NumPy 簡介
8.2 一維數組
8.2.1 數組與列表的異同
8.2.2 數組的創建
8.3 多維數組
8.3.1 多維數組的高效性能
8.3.2 多維數組的索引與切片
8.3.3 多維數組的屬性
8.4 數組的運算
第9章 pandas 數據清洗
9.1 數據讀寫、選擇、整理和描述
9.1.1 從 CSV 中讀取數據
9.1.2 向 CSV 寫入數據
9.1.3 數據選擇
9.1.4 數據整理
9.1.5 數據描述
9.2 數據分組、分割、合并和變形
9.2.1 數據分組
9.2.2 數據分割
9.2.3 數據合并
9.2.4 數據變形
9.2.5 案例:旅游數據的分析與變形
9.3 缺失值、異常值和重復值處理
9.3.1 缺失值處理
9.3.2 檢測和過濾異常值
9.3.3 移除重復數據
9.3.4 案例:旅游數據的值檢查與處理
9.4 時序數據處理
9.4.1 日期/時間數據轉換
9.4.2 時序數據基礎操作
9.4.3 案例:天氣數據分析與處理
9.5 數據類型轉換
9.6 正則表達式
9.6.1 元字符與限定符
9.6.2 案例:用正則表達式提取網頁文本信息
第10章 綜合應用實例
10.1 按性價比給用戶推薦旅游產品
10.1.1 數據采集
10.1.2 數據清洗、建模
10.2 通過熱力圖分析為用戶提供出行建議
10.2.1 某旅游網站熱門景點爬蟲代碼(qunaer_sights.py)
10.2.2 提取 CSV 文件中經緯度和銷量信息
10.2.3 創建景點門票銷量熱力地圖 HTML 文件
第11章 數據可視化
11.1 matplotlib
11.1.1 畫出各省份平均價格、各省份平均成交量柱狀圖
11.1.2 畫出各省份平均成交量折線圖、柱狀圖、箱形圖和餅圖
11.1.3 畫出價格與成交量的散點圖
11.2 pyecharts
11.2.1 Echarts 簡介
11.2.2 pyecharts 簡介
11.2.3 初識 pyecharts,玫瑰相送
11.2.4 pyecharts 基本語法
11.2.5 基于商業分析的 pyecharts 圖表繪制
11.2.6 使用 pyecharts 繪制其他圖表
11.2.7 pyecharts 和 Jupyter
編輯推薦
==============================================================
Python爬蟲技術的入門讀物通過實戰教初學者學習爬取數據、清洗和組織數據進行分析和可視化適合Python初學者、愛好者及高等院校的相關學生學習使用
作者簡介
==============================================================
沐垚科技創始人,電商自媒體,資深數據分析師,8年電商從業經驗,擅長Excel、Power BI、R、Python等工具,主要研究數據化運營、商業智能和人工智能在電商領域的應用,專注數據+電商的新零售服務。
出版
《電商數據分析淘寶實戰》
《美麗的電商運營日記》
《Excel BI 之道:從零開始學Power工具應用》
《淘寶、天貓電商數據分析與挖掘實戰》
聯系方式:
公眾號:start_data
個人號:haicheng1008
郵箱:lingyi@muyaotec
精彩書摘
==============================================================
精彩插圖
==============================================================
媒體評論
==============================================================
這本書教大家如何利用Python撰寫爬蟲程序,清洗和組織數據,解析網頁的內容,并將數據儲存于數據庫中。巨細無遺,幫助大家節省時間,是值得一讀的好書!
——國立臺灣大學資訊工程博士,銘傳大學資訊工程學系教授 李御璽 (Yue-Shi Lee)
零一兄的這本Python爬蟲技術是一個完整大數據應用框架:從數據收集、分析到數據可視化、數據建模。各章節以實際案例為出發點,對大數據分析、爬蟲技術應用感興趣的小伙伴們來說,這本書值得購買。
——愛數據學院創始人 數據海洋
互聯網時代,信息大爆炸,爬蟲技術被廣泛地用于原始數據的積累。零一以自己的親身實踐,用Python 3實現了抓取、存儲、清洗和可視化的數據處理操入門。作。本書語言簡潔、知識點全面、圖文并茂,讓爬蟲技術變得簡單易學,非常適合新手。
——《R的極客理想》系列圖書作者 張丹
內容簡介
==============================================================
本書內容來自筆者在浙江某高校授課內容,主要介紹運用Python工具獲取電商平臺的頁面數據,并對數據做清洗和存儲。本書簡化了Python基礎部分,保證有足夠的篇幅來介紹爬蟲和數據清洗的內容,對于Python基礎,建議新手可以選購對應的基礎書籍配合本書一起學習。
因資源下載地址容易失效,請加微信號359049049直接領取,直接發最新下載地址。
總結
以上是生活随笔為你收集整理的python3爬虫数据清洗与可视化实战pdf百度云_Python 3爬虫、数据清洗与可视化实战_PDF电子书...的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Web安全漏洞扫描神器-AWVS下载、安
- 下一篇: 山西民生云认证工资_山西民生云养老资格认