什么是“零宽字符”?
- 零宽度空格(Zero Width Space, U+200B):主要用于断词或排版控制(如阿拉伯语连字),不可见但可被复制粘贴。
- 零宽度非连接符(Zero Width Non-Joiner, U+200C):主要用于阻止相邻字符连写(常见于波斯语、阿拉伯语)。
- 零宽度连接符(Zero Width Joiner, U+200D):主要用于强制字符连写。
- 零宽度非断空格(Word Joiner, U+FEFF):主要用于替代传统空格防止换行断开。
如何插入“零宽字符”?
“零宽字符”对邮件影响案例分析
发送一封主题包含零宽字符的邮件
通过“MailABC”关键字搜索该邮件,发现无匹配结果。但是通过“Mail”或者“ABC”关键字可以搜出结果。发送一封主题不包含零宽字符的邮件,仍是以“MailABC”为主题,此时可以发现可以正常搜索出该主题邮件。
通过这个简单的演示示例可以看出,零宽字符对关键词匹配造成了干扰。在邮件领域,此类干扰可能会影响反垃圾过滤、关键字过滤等功能。