标签:
网上找了好久,都没有理想的解决方法。主要思想,利用正则表达式re.split() 分割,同时利用re.findall() 查找分隔符,而后将二者链接即可。
# coding: utf-8 import sys reload(sys) sys.setdefaultencoding("utf-8") import re def my_split(str,sep=u"要求\d+|岗位\S+"): # 分隔符可为多样的正则表达式 wlist = re.split(sep,str) sepword = re.findall(sep,str) sepword.insert(0,"") # 开头插入一个空字符串,以保持长度和切割成分相同 wlist = [ x+y for x,y in zip(wlist,sepword) ] # 顺序可根据需求调换 return wlist if __name__ == "__main__": inputstr = "岗位:学生: \n要求1.必须好好学习。\n要求2.必须踏实努力。\n要求3.必须求实上进。" res = my_split(inputstr) print ‘\n‘.join(res)
标签:
原文地址:http://www.cnblogs.com/jkmiao/p/4767762.html