标签:
1.在mysql中对t_movie_douban的title进行排序,注意去掉NULL
setwd(‘F:/M 2013/chs/work‘) con<-file(‘movie_title_sorted.txt‘, ‘r‘) txt<-readLines(con) series_OVA_index<-grep(‘OVA‘, txt) series_OVA<-txt[series_OVA_index] writeLines(series_OVA, ‘seriesOVA.txt‘)
共有261个结果,注意到有例外的情况(用红框圈出)
例外情况:
(OVA实际是标题的一部分)
NOVA珠穆朗玛死亡地带
兽装机攻断空我NOVA
(OVA在前面)
OVA 东京喰种トーキョーグール JACK
OVA 东京喰种トーキョーグール【PINTO】
再判断OAD:
series_OAD_index<-grep(‘OAD‘, txt) series_OAD<-txt[series_OAD_index] writeLines(series_OAD, ‘seriesOAD.txt‘)
共107条结果,如下:
例外情况:
热风海陆BUSHIROAD 通往希望的道路
标签:
原文地址:http://www.cnblogs.com/wacc/p/4907490.html