码迷,mamicode.com
首页 > 其他好文 > 详细

R-长尾词练习

时间:2019-12-20 22:19:06      阅读:120      评论:0      收藏:0      [点我收藏+]

标签:for   而且   frame   library   com   字符串   hat   大量   cli   

一、 长尾关键词的特征 

长尾关键词通常比较长,往往是2-3个词组成,甚至是短语,存在于内容页面,除了内容页的标题,还存在于内容中。

长尾关键词搜索量虽然非常少,而且不稳定。但是搜索量甚至超越热门目标关键词,并且在大中型网站中占据大量流量! 

技术图片

 

 

先在excel复制

技术图片

读取长尾词

#读取长尾词
changwc<-scan("clipboard",what = "")
changwc
技术图片

读取结果词

先复制:

技术图片

#读取结果词
jiegc<-scan("clipboard",what = "")
jiegc
技术图片
str_detect()只返回是否符合的逻辑值,实际上计数更实用。
x <- c("apple", "banana", "pear")
str_detect(x, "e")
#> [1] TRUE FALSE TRUE
install.packages("stringr")
library(stringr)
str_detect("可可登录","可可")

#创建5个空的字符串向量
a1<-a2<-a3<-a4<-a5<-character(length(changwc))
#创建一个空的数据框
xx<-data.frame(可可=a1,登录=a2,官网=a3,课堂=a4,怎么样=a5)
技术图片

 

k<-1
cd<-length(changwc)
for (i in jiegc) {
  ff<-changwc[str_detect(changwc,i)]
  dd<-c(ff,character(cd-length(ff)))
  xx[,k]<-dd
  k<-k+1
  changwc<-changwc[!changwc%in%ff]
}
xx
技术图片
#写入Excel文件
write.csv(xx,"长尾词分组.csv",row.names=F)

技术图片

 

 

 

1111

R-长尾词练习

标签:for   而且   frame   library   com   字符串   hat   大量   cli   

原文地址:https://www.cnblogs.com/foremostxl/p/12075108.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!