码迷,mamicode.com
首页 > 编程语言 > 详细

R语言LDA包数据预处理脚本

时间:2015-07-20 19:29:17      阅读:323      评论:0      收藏:0      [点我收藏+]

标签:

docs<-list()

setwd("E:/test/");
dirlist<-dir();

voc<-c()


for(file in dirlist)
{
  f<-paste(getwd(),‘/‘,file,sep=‘‘)
 
  data <- scan(f, what="")
  data <- gsub("[^\\w-]", "", data, perl=TRUE)
  voc<-c(voc,data)
  voc<-voc[!duplicated(voc)]
  print(data)
  df <- sort(table(tolower(data)))
  print("---")
  na<-names(df)
  v<-c()
  for(n in na)
  {
      v<-c(v,which(voc==n))
  }
  m<-rbind(v,df)
  lt<-list(m)
  print(m)
  print(df)
  docs <-append(docs,lt)
 
}
docs

版权声明:本文为博主原创文章,未经博主允许不得转载。

R语言LDA包数据预处理脚本

标签:

原文地址:http://blog.csdn.net/guoguo11191/article/details/46971797

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!