出自群里的提问,试了几次就实现了,现在分享出来。
1
2
3
4
5
6
|
#coding=utf-8 import re s = 'hi新手oh' .decode( 'utf-8' ) #举个栗子是字符串s,为了匹配下文的unicode形式,所以需要解码 p = re. compile (ur '[\u4e00-\u9fa5]' ) #这里是精髓,[\u4e00-\u9fa5]是匹配所有中文的正则,因为是unicode形式,所以也要转为ur print p.split(s) #使用re库的split切割 |
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END
暂无评论内容