标签:fct 设计 转换 公式 类方法 网址 内容 聚类 源码
** 实现步骤
1、抓取指定网址的源码;
2、解析网页文章内容;
3、对文章内容进行分词,并转换成向量表示(词袋法或TF.IDF);
4、选取合适的距离公式和聚类算法进行聚类,要求聚成3类。(可以用欧式距离或余弦距离等。聚类方法可以考虑用K-means方法等。)
标签:fct 设计 转换 公式 类方法 网址 内容 聚类 源码
原文地址:https://www.cnblogs.com/FireTim/p/14966995.html