机器学习-数据科学库(第一天)
01.數據分析的介紹
什么是數據分析
數據分析是用適當的方法對收集來的大量數據進行分析,幫助人們作出判斷,以便采取適當行動。
數據分析流程
03.matplotlib的基礎繪圖
為什么要學習matplotlib
matplotlib基本要點
axis軸,指的是x或者y這種坐標軸
from matplotlib import pyplot as plt x=range(2,26,2) y=[15,13,14.5,17,20,25,26,26,24,22,18,15]#繪圖 plt.plot(x,y) #顯示圖片 plt.show()04.matplotlib的基礎繪圖和調整x軸的刻度
調整x軸的刻度
from matplotlib import pyplot as plt x=range(2,26,2) y=[15,13,14.5,17,20,25,26,26,24,22,18,15] #設置圖片大小 plt.figure(figsize=(20,8),dpi=60) #繪圖 plt.plot(x,y) #設置x軸的刻度 plt.xticks(range(2,25)) _xtick_labels = [i/2 for i in range(4,49)] plt.xticks(_xtick_labels[::3]) #保存 plt.savefig(".t1.png") #顯示圖片 plt.show()05.matplotlib的繪制10點到12點的氣溫
繪制10點到12點的氣溫
那么問題來了: ? ? ? ?
如果列表a表示10點到12點的每一分鐘的氣溫,如何繪制折線圖觀察每分鐘氣溫的變化情況? ?
?a= [random.randint(20,35) for i in range(120)]
from matplotlib import pyplot as plt import random x=range(0,120) y=[random.randint(20,35) for i in range(120)] #繪圖 plt.plot(x,y) #顯示圖片 plt.show()06.matplotlib設置顯示中文
matplotlib設置顯示中文
from matplotlib import pyplot as plt import random import matplotlib from matplotlib import font_managermy_font=font_manager.FontProperties(fname="/System/Library/Fonts/PingFang.ttc")x=range(0,120) y=[random.randint(20,35) for i in range(120)] plt.figure(figsize=(20,8),dpi=80) #繪圖 plt.plot(x,y)_xtick_lables = ["10點{}分".format(i) for i in range(60)] _xtick_lables += ["11點{}分".format(i) for i in range(60)] plt.xticks(list(x)[::3],_xtick_lables[::3],rotation=45,fontproperties=my_font) #顯示圖片 plt.show()07.matplotlib的設置圖形信息
matplotlib的設置圖形信息
from matplotlib import pyplot as plt import random import matplotlib from matplotlib import font_managermy_font=font_manager.FontProperties(fname="/System/Library/Fonts/PingFang.ttc")x=range(0,120) y=[random.randint(20,35) for i in range(120)] plt.figure(figsize=(20,8),dpi=80) #繪圖 plt.plot(x,y)_xtick_lables = ["10點{}分".format(i) for i in range(60)] _xtick_lables += ["11點{}分".format(i) for i in range(60)] plt.xticks(list(x)[::3],_xtick_lables[::3],rotation=45,fontproperties=my_font) plt.xlabel("時間",fontproperties=my_font) plt.ylabel("溫度 單位(攝氏度)",fontproperties=my_font) plt.title("10點到12點每分鐘的氣溫變化情況",fontproperties=my_font)#顯示圖片 plt.show()08.繪制多次圖形和不同圖形的差異介紹和總結
繪制多次圖形和不同圖形的差異介紹和總結
假設大家在30歲的時候,根據自己的實際情況,統計出來了從11歲到30歲每年交的女(男)朋友的數量如列表a,請繪制出該數據的折線圖,以便分析自己每年交女(男)朋友的數量走勢
a = [1,0,1,1,2,4,3,2,3,4,4,5,6,5,4,3,3,1,1,1]
要求:? ? ?y軸表示個數 ? ? x軸表示歲數,比如11歲,12歲等
from matplotlib import pyplot as plt import matplotlib from matplotlib import font_managerx=range(11,31) y=[1,0,1,1,2,4,3,2,3,4,4,5,6,5,4,3,3,1,1,1] my_font=font_manager.FontProperties(fname="/System/Library/Fonts/PingFang.ttc")#設置圖形大小 plt.figure(figsize=(20,8),dpi=80) #繪圖 plt.plot(x,y) plt.grid(alpha=0.1)_xtick_lables=["{}歲".format(i) for i in x] plt.xticks(x,_xtick_lables,fontproperties=my_font)#顯示圖片 plt.show()假設大家在30歲的時候,根據自己的實際情況,統計出來了你和你同桌各自從11歲到30歲每年交的女(男)朋友的數量如列表a和b,請在一個圖中繪制出該數據的折線圖,以便比較自己和同桌20年間的差異,同時分析每年交女(男)朋友的數量走勢
a = [1,0,1,1,2,4,3,2,3,4,4,5,6,5,4,3,3,1,1,1] b = [1,0,3,1,2,2,3,3,2,1 ,2,1,1,1,1,1,1,1,1,1]
要求: ? ? y軸表示個數 ? ? x軸表示歲數,比如11歲,12歲等
from matplotlib import pyplot as plt import matplotlib from matplotlib import font_managerx=range(11,31) y_1=[1,0,1,1,2,4,3,2,3,4,4,5,6,5,4,3,3,1,1,1] y_2=[1,0,3,1,2,2,3,3,2,1 ,2,1,1,1,1,1,1,1,1,1] my_font=font_manager.FontProperties(fname="/System/Library/Fonts/PingFang.ttc")#設置圖形大小 plt.figure(figsize=(20,8),dpi=80) #繪圖 plt.plot(x,y_1) plt.plot(x,y_2) plt.grid(alpha=0.1)_xtick_lables=["{}歲".format(i) for i in x] plt.xticks(x,_xtick_lables,fontproperties=my_font)#顯示圖片 plt.show() from matplotlib import pyplot as plt import matplotlib from matplotlib import font_managerx=range(11,31) y_1=[1,0,1,1,2,4,3,2,3,4,4,5,6,5,4,3,3,1,1,1] y_2=[1,0,3,1,2,2,3,3,2,1 ,2,1,1,1,1,1,1,1,1,1] my_font=font_manager.FontProperties(fname="/System/Library/Fonts/PingFang.ttc")#設置圖形大小 plt.figure(figsize=(20,8),dpi=80) #繪圖 plt.plot(x,y_1,label="自己",color="orange",linestyle=":") plt.plot(x,y_2,label="同桌",color="c",linestyle="-.") plt.grid(alpha=0.5)_xtick_lables=["{}歲".format(i) for i in x] plt.xticks(x,_xtick_lables,fontproperties=my_font)#添加圖例 plt.legend(prop=my_font,loc="upper left") #顯示圖片 plt.show()matplotlib能夠繪制折線圖,散點圖,柱狀圖,直方圖,箱線圖,餅圖等
但是,我們需要知道不同的統計圖到底能夠表示出什么,以此來決定選擇哪種統計圖來更直觀的呈現我們的數據
對比常用統計圖
折線圖:以折線的上升或下降來表示統計數量的增減變化的統計圖
特點:能夠顯示數據的變化趨勢,反映事物的變化情況。(變化)
直方圖:由一系列高度不等的縱向條紋或線段表示數據分布的情況。
一般用橫軸表示數據范圍,縱軸表示分布情況。 特點:繪制連續性的數據,展示一組或者多組數據的分布狀況(統計)
條形圖:排列在工作表的列或行中的數據可以繪制到條形圖中。
特點:繪制連離散的數據,能夠一眼看出各個數據的大小,比較數據之間的差別。(統計)
散點圖:用兩組數據構成多個坐標點,考察坐標點的分布,判斷兩變量 之間是否存在某種關聯或總結坐標點的分布模式。
特點:判斷變量之間是否存在數量關聯趨勢,展示離群點(分布規律)
總結
以上是生活随笔為你收集整理的机器学习-数据科学库(第一天)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Python数据结构与算法(第七天)
- 下一篇: 机器学习-数据科学库(第二天)