最近有项目需要去某个文件夹里面,获取所有XML文件,然后从XML文件中查找特定节点中查找是否有特定信息。 为了便于获取所有文件信息,直接用bat文件每天自动运行生成一个文件列表list信息供查看。 cd /d %~dp0 dir /s /b *.* > FileList.txt 所以接下来要做的事情 ...
分类:
编程语言 时间:
2021-07-05 16:50:22
阅读次数:
0
setting from fake_useragent import UserAgent BOT_NAME = 'carhome' SPIDER_MODULES = ['carhome.spiders'] NEWSPIDER_MODULE = 'carhome.spiders' ROBOTSTXT_ ...
分类:
其他好文 时间:
2021-07-01 17:35:31
阅读次数:
0
ideavim插件配置 set scrolloff=3 " 3 lines above/below cursor when scrolling " 突出显示当前行 set cursorline " 在状态栏显示正在输入的命令 set showcmd " Emulated Plugins set su ...
分类:
系统相关 时间:
2021-06-29 16:11:42
阅读次数:
0
Markdown learning h2 h3 h4 font hello,world! hello,world! hello,world! hello,world! hello,world! hello,world! quote choose Java, split lines picture h ...
分类:
其他好文 时间:
2021-06-17 16:39:11
阅读次数:
0
跑命令bedtools genomecov -ibam file.bam -bga -split -trackline > file.wig时出现的报错。 解决方案: samtools sort file.bam -T /tmep -o file.sorted.bam #/tmep指的是新建一个tm ...
分类:
其他好文 时间:
2021-06-13 09:43:05
阅读次数:
0
set pages 50000 set lines 800 col grp format a5 ...
分类:
数据库 时间:
2021-06-07 20:22:56
阅读次数:
0
1. 准备文本文件: 从文件创建RDD lines=sc.textFile(): 筛选出含某个单词的行 lines.filter(),lambda 参数:条件表达式: 2. 生成单词的列表: 从列表创建RDD words=sc.parallelize(): 筛选出长度大于2 的单词 words.fi ...
分类:
其他好文 时间:
2021-06-07 20:04:33
阅读次数:
0
一、filter,map,flatmap练习: 1.读文本文件生成RDD lines 2.将一行一行的文本分割成单词 words 3.全部转换为小写 4.去掉长度小于3的单词 5.去掉停用词 二、groupByKey练习 6.练习一的生成单词键值对 7.对单词进行分组 8.查看分组结果 学生科目成绩 ...
分类:
其他好文 时间:
2021-06-07 20:04:10
阅读次数:
0
1、OS模块 函数/变量 描述 os.environ 系统的环境变量 os.system(command) 在子shell中执行操作系统命令, 注意使用双引号,没有加入系统环境变量的应用,要使用全路径,否则直接使用可执行程序如pycharm64.exe os.sep 路径中使用的分隔符 os.pat ...
分类:
编程语言 时间:
2021-05-24 17:23:30
阅读次数:
0
记录一次将文件数据插入数据库中 LOAD DATA LOCAL INFILE 'D:\Users\Downloads\test.txt' INTO TABLE test_table FIELDS TERMINATED BY '|' OPTIONALLY ENCLOSED BY '"' LINES T ...
分类:
数据库 时间:
2021-05-24 04:03:25
阅读次数:
0