基于大数据的高校生源可视化分析系统
溫馨提示:文末有 CSDN 平臺官方提供的學長 Wechat / QQ 名片 :)
1. 項目簡介
????????隨著高校新生的增加,學生的數(shù)據(jù)也越來也多,怎么使用 好這些數(shù)據(jù),對數(shù)據(jù)進行分析和挖掘成為了研究的熱點,本次課題就是通過獲取某學校的學生相關信息,利用 pandas + Matplotlib + seaborn 等工具包以可視化的方式從不同層面進行數(shù)據(jù)的分析。
2. 數(shù)據(jù)讀取
df_2019 = pd.read_excel('數(shù)據(jù)/2019年_3200人.xlsx',sheet_name='mySheet') df_2020 = pd.read_excel('數(shù)據(jù)/2020年_3200人.xlsm',sheet_name='mySheet (2)') df_2021 = pd.read_excel('數(shù)據(jù)/2021年_2860人.xlsm',sheet_name='mySheet (3)')3. 數(shù)據(jù)探索式可視化分析
3.1?各專業(yè)填報志愿人數(shù)分布情況
? ? ? ? ?2019年和2020年的各專業(yè)填報分數(shù)分布箱型圖可類比繪制出,篇幅限制暫省略。?
3.2 各專業(yè)的投檔成績分布情況
xueyuan_6_dict = {k: 0 for k in set(df_2019['專業(yè)名稱'])} for xueyuan in xueyuan_6_dict:xueyuan_df = df_2019[df_2019['專業(yè)名稱'] == xueyuan]if xueyuan_df.shape[0] == 0:continuedefen = xueyuan_df['投檔成績'].valuesdefen = defen[defen > 0]xueyuan_6_dict[xueyuan] = defen.tolist()plt.figure(figsize=(16, 10)) plt.boxplot(xueyuan_6_dict.values(), labels = xueyuan_6_dict.keys()) plt.title('2019年各專業(yè)填報分數(shù)分布箱型圖', fontdict={'weight':'normal','size': 20}) pl.xticks(rotation=90) plt.show()? ? ? ? ?2019年和2020年的各專業(yè)填報分數(shù)分布箱型圖可類比繪制出,篇幅限制暫省略。
3.3 報考學生戶口所在地分布情況
plt.figure(figsize=(16, 6)) plt.subplot(121) plt.pie(counts, labels = cities) plt.title('2020年報考學生戶口所在城市數(shù)量分布餅狀圖', fontdict={'weight':'normal','size': 12})plt.subplot(122) plt.bar(cities, counts, color='#FF5151') plt.title('2020年報考專業(yè)是否需要外語口試數(shù)量分布柱狀圖', fontdict={'weight':'normal','size': 12}) pl.xticks(rotation=45)plt.show()3.4 報考學生的外語語種分布餅狀圖
3.5?需要考察外語口試的專業(yè)?
3.6?連續(xù)三年招生的專業(yè)總分分布情況
plt.figure(figsize=(16, 15)) pl.subplots_adjust(left=0.0,bottom=0.0,top=2,right=1)xueyuan_count = len(zhuanye['專業(yè)名稱']) x = xueyuan_count // 2 + 1 for i, xueyuan in enumerate(zhuanye['專業(yè)名稱']):y = 2z = i + 1plt.subplot(x, y, z)zf = df_2019[df_2019['專業(yè)名稱'] == xueyuan]['投檔成績']zf = zf[zf > 0]sns.kdeplot(zf, label='2019年')zf = df_2020[df_2020['專業(yè)名稱'] == xueyuan]['投檔成績']zf = zf[zf > 0]sns.kdeplot(zf, label='2020年')zf = df_2021[df_2021['專業(yè)名稱'] == xueyuan]['投檔成績']zf = zf[zf > 0]sns.kdeplot(zf, label='2021年')plt.title('2019年 ~ 2021年' + xueyuan + '招生總分分布情況', fontdict={'weight':'normal','size': 12})plt.legend() plt.show()3.7 2021年各省招生的錄取平均分分布情況
city_mean_score = df_2021[['戶口所在省市', '投檔成績']].groupby('戶口所在省市').mean().reset_index() city_mean_score['熱門戶口所在地'] = city_mean_score['戶口所在省市'].map(lambda x: x in cities) city_mean_score = city_mean_score[city_mean_score['熱門戶口所在地'] == True] plt.figure(figsize=(16, 6)) plt.bar(city_mean_score['戶口所在省市'], city_mean_score['投檔成績'], color='#66B3FF') plt.title('2021年熱門城市報考學生平均成績分布柱狀圖', fontdict={'weight':'normal','size': 12}) pl.xticks(rotation=45) plt.show()4. 總結(jié)
????????隨著高校新生的增加,學生的數(shù)據(jù)也越來也多,怎么使用 好這些數(shù)據(jù),對數(shù)據(jù)進行分析和挖掘成為了研究的熱點,本次課題就是通過獲取某學校的學生相關信息,利用 pandas + Matplotlib + seaborn 等工具包以可視化的方式從不同層面進行數(shù)據(jù)的分析。
歡迎大家點贊、收藏、關注、評論啦 ,由于篇幅有限,只展示了部分核心代碼。
技術交流認準下方?CSDN 官方提供的學長 Wechat / QQ 名片 :)
?精彩專欄推薦訂閱:
1. Python 畢設精品實戰(zhàn)案例
2. 自然語言處理 NLP 精品實戰(zhàn)案例
3. 計算機視覺 CV 精品實戰(zhàn)案例
總結(jié)
以上是生活随笔為你收集整理的基于大数据的高校生源可视化分析系统的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 在蝰蛇峡谷上实现YOLOv5模型的Ope
- 下一篇: dSPACE ModelDesk Roa