关于中文字符匹配js正则表达式

浏览数：21 / 时间：2015年06月09日

 普遍使用的正则是[\u4e00-\u9fa5]，但这个范围并不完整。例如：  

 /[\u4e00-\u9fa5]/.test( ‘?‘ ) // 测试部首?，返回false  

 根据Unicode 5.0版编码，要准确的判断一个中文字符要包括：  

 范围            含义                范围               含义  

 2E80-2EFF   CJK 部首补充    2F00-2FDF   康熙字典部首  

 3000-303F   CJK 符号和标点   31C0-31EF   CJK 笔画  

 3200-32FF   封闭式 CJK 文字和月份   3300-33FF   CJK 兼容  

 3400-4DBF   CJK 统一表意符号扩展 A  4DC0-4DFF   易经六十四卦符号  

 4E00-9FBF   CJK 统一表意符号  F900-FAFF   CJK 兼容象形文字  

 FE30-FE4F   CJK 兼容形式    FF00-FFEF   全角ASCII、全角标点  

 因此，正确的匹配中文字符正则表达式为：  

 var rcjk = /[\u2E80-\u2EFF\u2F00-\u2FDF\u3000-\u303F\u31C0-\u31EF\u3200-\u32FF\u3300-\u33FF\u3400-\u4DBF\u4DC0-\u4DFF\u4E00-\u9FBF\uF900-\uFAFF\uFE30-\uFE4F\uFF00-\uFFEF]+/g;  

 如果不希望匹配标点、符号，在正则中去掉对应的范围即可：  

 3000-303F   CJK 符号和标点   FF00-FFEF   全角ASCII、全角标点 

郑重声明：本站内容如果来自互联网及其他传播媒体，其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享，并不代表本站赞同其观点和对其真实性负责，也不构成任何其他建议。

关于中文字符匹配js正则表达式

标签： style 使用 si it la sp ca js as style 使用 si it la sp ca js as

关于中文字符匹配js正则表达式

相关文章

随机文章

您可能还喜欢

您可能还喜欢

最新图文

您可能还喜欢

您可能还喜欢

文摘排行

文章排行

推荐文章

图文排行

推荐图文