python拆分中英文混合字符串 – 按中文拆分

出自群里的提问,试了几次就实现了,现在分享出来。

1
2
3
4
5
6
#coding=utf-8
import re
s= 'hi新手oh'.decode('utf-8')#举个栗子是字符串s,为了匹配下文的unicode形式,所以需要解码
p= re.compile(ur'[\u4e00-\u9fa5]')#这里是精髓,[\u4e00-\u9fa5]是匹配所有中文的正则,因为是unicode形式,所以也要转为ur
  
print p.split(s)#使用re库的split切割
© 版权声明
THE END
喜欢就支持一下吧
点赞13 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片

    暂无评论内容