数据处理踩过的坑(不断更新):
生活随笔
收集整理的這篇文章主要介紹了
数据处理踩过的坑(不断更新):
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
1.使用布爾掩碼作為索引過濾數據:(4.18)
- 一、對數組或Series用布爾數組進行過濾,濾去對應位置為False的值,只保留對應位置為True的值:
- 二、對DataFrame用布爾數組進行過濾,在False的位置填充缺省值(注意區別): 此時,若想要在特定的某一列中尋找特定的值: 若想要選取存在絕對值大于1.5的數據的行,通過布爾數組配合any()實現:
2.DataFrame對象才能使用.join()方法:(4.18)
合并數據集的時候發現報錯:
檢查發現, 所以,3.獲取DataFrame進行groupby分組后的某一列的兩種等效方法:
現在獲取按key1分組后的data1這一列數據: 對方法一的理解: 按照groupby()中參數列表對data['data1']這一列進行分組,分組方式與原數據集DataFrame無關,只與groupby()中參數列表有關,故不能省略為groupby('key1'): 對方法二的理解: 先按照groupby()中的參數對原數據集DataFrame進行分組,再從各組中選出data1列,分組方式與原數據集DataFrame有關,故能省略為groupby('key1'):3.數組拼接時的維度問題:
- 在拼接數組的時候出現了這么一個錯誤:
- 原來是轉置后的數組維度與x的維度不匹配,改變創建全一數組的形狀或者通過reshape方法可以解決:
- 拼接成功:
轉載于:https://juejin.im/post/5cb883466fb9a0688539b4d7
總結
以上是生活随笔為你收集整理的数据处理踩过的坑(不断更新):的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Yarn ResourceManager
- 下一篇: MaxCompute 图计算开发指南