使用正则统计汉字和英文单词数
- 2011年05月27日 [已被偷窥 5,909 次]
一个简单的程序,统计文本文档中的单词和汉字数,逆序排列(出现频率高的排在最前面)。python实现。
思路
使用正则式 "(?x) (?: [\w-]+ | [\x80-\xff]{3} )"获得utf[……]
按 ‘ 正则表达式 ’ 标签归档
一个简单的程序,统计文本文档中的单词和汉字数,逆序排列(出现频率高的排在最前面)。python实现。
思路
使用正则式 "(?x) (?: [\w-]+ | [\x80-\xff]{3} )"获得utf[……]
一 | 二 | 三 | 四 | 五 | 六 | 日 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |