NLP:利用DictVectorizer对使用字典存储的数据进行特征抽取与向量化
生活随笔
收集整理的這篇文章主要介紹了
NLP:利用DictVectorizer对使用字典存储的数据进行特征抽取与向量化
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
NLP:利用DictVectorizer對使用字典存儲的數據進行特征抽取與向量化
?
?
目錄
輸出結果
實現代碼
?
?
?
輸出結果
?
實現代碼
#定義一組字典列表,用來表示多個數據樣本(每個字典代表一個數據樣本) from sklearn.feature_extraction import DictVectorizer measurements = [{'city': 'Shang Hai', 'temperature': 33.}, {'city': 'Bei Jing', 'temperature': 12.}, {'city': 'Las Vegas', 'temperature': 18.}] vec = DictVectorizer() #初始化DictVectorizer特征抽取器 print(vec.fit_transform(measurements).toarray()) #輸出轉化之后的特征矩陣 print(vec.get_feature_names()) #輸出各個維度的特征含義?
總結
以上是生活随笔為你收集整理的NLP:利用DictVectorizer对使用字典存储的数据进行特征抽取与向量化的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: ML之NB:利用朴素贝叶斯NB算法(Co
- 下一篇: HighNewTech—AI界消息:20