Erlo

python3如何提取汉字

2021-05-19 12:31:35 发布   488 浏览  
页面报错/反馈
收藏 点赞

采用正则表达式的方法对字符串进行处理。

str1 = "{我%$是,《速$@.度发》中 /国、人"

相关推荐:《Python教程》

(1)提取汉字

汉字的范围为”u4e00-u9fa5“,这个是用Unicode表示的。

import re
res1 = ''.join(re.findall('[u4e00-u9fa5]',str1))
print(res1)

输出为:

‘我是速度发中国人’

(2)去除所有符号。采用清理数据,仅保留字母、数字、中文的方法。

import re
res1 = re.sub("[^a-zA-Z0-9u4e00-u9fa5]", '', str1) 
print(res1)

输出为:

‘我是速度发中国人’

您可能感兴趣的文章:

登录查看全部

参与评论

评论留言

还没有评论留言,赶紧来抢楼吧~~

手机查看

返回顶部

给这篇文章打个标签吧~

棒极了 糟糕透顶 好文章 PHP JAVA JS 小程序 Python SEO MySql 确认