码迷,mamicode.com
首页 > 编程语言 > 详细

python 文本或句子切割,并保留分隔符

时间:2015-08-28 21:26:03      阅读:603      评论:0      收藏:0      [点我收藏+]

标签:

网上找了好久,都没有理想的解决方法。主要思想,利用正则表达式re.split() 分割,同时利用re.findall() 查找分隔符,而后将二者链接即可。

# coding: utf-8

import sys
reload(sys)
sys.setdefaultencoding("utf-8")

import re


def my_split(str,sep=u"要求\d+|岗位\S+"):  # 分隔符可为多样的正则表达式
    wlist = re.split(sep,str)
    sepword = re.findall(sep,str)
    sepword.insert(0,"") # 开头插入一个空字符串,以保持长度和切割成分相同
    wlist = [ x+y for x,y in zip(wlist,sepword) ] # 顺序可根据需求调换
    return wlist



if __name__ == "__main__":
    inputstr = "岗位:学生: \n要求1.必须好好学习。\n要求2.必须踏实努力。\n要求3.必须求实上进。"
    res = my_split(inputstr)
    print \n.join(res)

 

python 文本或句子切割,并保留分隔符

标签:

原文地址:http://www.cnblogs.com/jkmiao/p/4767762.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!