按 ‘ 正则表达式 ’ 标签归档

使用正则统计汉字和英文单词数

一个简单的程序,统计文本文档中的单词和汉字数,逆序排列(出现频率高的排在最前面)。python实现。

 

思路

使用正则式 "(?x) (?: [\w-]+  | [\x80-\xff]{3} )"获得utf-8文档中的英文单词和汉字的列表。

使用dictionary来记录每个单词/汉字出现 猛击传送门查看更多

第 1 页,共 1 页1

网站统计

文章总数:655 篇
评论总数:2466 条
标签总数:204 个
网站运行:3096天
总浏览量:4,099,3270 次
最近更新:2018年8月2日