分类标签归档:正则

中文python正则匹配[\u4e00-\u9fa5]


由于 需求原因,需要匹配 提取中文,大量google下,并没有我需要的。花了一个小时大概测试,此utf8中文通过,特留文。 参考: http://topic.csdn.net/u/20070404/15/b011aa83-f9b7-43b3-bbff-bfe4f653df03.html

首先,确保所有编码都为 unicode 比如 str.decode('utf8') #从utf8文本中 u...

Read more