码迷,mamicode.com
首页 > 其他好文 > 详细

机器学习——朴素贝叶斯

时间:2018-10-08 23:10:22      阅读:219      评论:0      收藏:0      [点我收藏+]

标签:form   intel   机器   朴素贝叶斯   vector   rap   ace   article   大量   

 在考虑一个结果的概率时候,要考虑众多的属性,贝叶斯算法利用所有可能的数据来进行修正预测,如果大量的特征产生的影响较小,放在一起,组合的影响较大,适合于朴素贝叶斯分类

导入类库

1 from sklearn.datasets import fetch_20newsgroups
2 from sklearn.feature_extraction.text import TfidfVectorizer
3 from sklearn.naive_bayes import MultinomialNB

代码

 1 def article_category():
 2     categories = [alt.atheism, soc.religion.christian, comp.graphics, sci.med]
 3     twenty_train = fetch_20newsgroups(subset=train, categories=categories)
 4     # print(twenty_train)
 5     print(twenty_train.data)
 6     print(twenty_train.target)
 7     # 将x训练集词频向量化
 8     tfidf_transformer = TfidfVectorizer()
 9     X_train_tfidf = tfidf_transformer.fit_transform(twenty_train.data)
10 
11     # 贝叶斯训练
12     clf = MultinomialNB(alpha=1.0).fit(X_train_tfidf, twenty_train.target)
13     docs_new = [Chemical reaction, Intel CPU is good]
14 
15     # 将要预测的数据词频向量化
16     X_new_tfidf = tfidf_transformer.transform(docs_new)
17     # 预测
18     predicted = clf.predict(X_new_tfidf)
19     print(predicted)
20     for doc, category in zip(docs_new, predicted):
21         print(%r => %s % (doc, twenty_train.target_names[category]))

 

机器学习——朴素贝叶斯

标签:form   intel   机器   朴素贝叶斯   vector   rap   ace   article   大量   

原文地址:https://www.cnblogs.com/siplips/p/9757642.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!