空格、空格和空格¶
盛勃
2023年6月26日 0:42:32
空格(space),Basic Latin U+0020 ——一般按键盘打出的 ASCII 字符
全宽空格(em space)系列,General Punctuation U+2000 – U+200A ——“em”即 m,em 空格的宽度与 m 相同,半宽空格的“en”同理。由此可衍生出各种宽度的空格。这些空格可与标点符号合用。例如“the final frontier—space”中,破折号前后过紧,可插入 hair space 填充。
不间断空格(no-break space),Latin-1 Supplement U+00A0 ——你可能见过
,就是它。HTML 为了允许缩进,连续空格作单一空格解读。那么怎样空出一大段“ ”呢?用一系列
替代即可。
零宽空格(zero width space),General Punctuation U+200B ——这是格式字符,可用于指示单词边界。例如“Dear Sir/Madam”的斜线前后就可加这种空格,这可能影响文本在何处换行。另外,零宽空格听起来就自相矛盾,没有广泛支持,输入它能搞坏不少终端的显示系统。(不要妄图用零宽空格写不缩进的 python 代码)
象形文字空格(ideographic space),CJK Symbols and Punctuation U+3000 ——宽度与中日韩象形文字相等,一般输入法打出的全宽空格就是它。
Python 标准库 unicodedata 包含了这些数据。
>>> from unicodedata import name, lookup
>>> lookup("em space")
'\u2003'
>>> print(f"→{_}←")
→ ←
>>> name("")
'IDEOGRAPHIC SPACE'
Adventures in Space: Spaces | FontShop
General Punctuation, , 112 symbols, Unicode Range: 2000-206F (◕‿◕) SYMBL