关于排版和字符集
关于引号
和句点/句号、逗号、问号、感叹号等标点符号不同,中英文的单双引号使用的是同一组Unicode码元:
“[U+201C] Left Double Quotation Mark “左双引号””[U+201D] Right Double Quotation Mark “右双引号”‘[U+2018] Left Single Quotation Mark “左单引号”’[U+2019] Right Single Quotation Mark “右单引号”
这导致在混合排版过程中,即使分别指定了中英文语言字体,引号的字形也必须要考虑所在文本块的语言设置才能正确呈现。在Web中,必须显式设置字体才能在对应的语段使用正确的字形。
<span style="font-family:SimSun, 'Times New Roman'">他说:“Hello World”</span>
<span style="font-family:'Times New Roman', SimSun">He said, “你好世界”</span>
他说:“Hello World”
He said, “你好世界”
在Word中,对于支持多语种字体的文本(例如希腊字母、引号等),除了手动设置字体之外,还可以通过设置对应语段的语言来以自动适配字形。只要将选中文本将语言改为英语(美国),之后再通过输入插入希腊字母或引号时就会自动使用西文字体。
顺带一提,Unicode并没有提供全角弯引号。其中收录的" [U+FF02] Fullwidth Quotation Mark “全角引号”和' [U+FF07] Fullwidth Apostrophe “全角撇号”是ASCII字符" [U+0022] Quotation Mark “引号/直双引号”和' [U+0027] Apostrophe “撇号/直单引号”的全角化,后两者是编程语言中的引号符。这四个符号在中英文印刷排版领域均不是规范的标点。
关于横线:minus, hyphen, endash, emdash和破折号
在中英文印刷排版领域,有几种标点符号以横线的形式呈现,分别是hyphen(连字符)、en dash、em dash、minus(减号)、一字线和破折号。
与之相关的Unicode码元包括:
- ASCII符号
-[U+002D] Hyphen-Minus “短横线” - 通用标点
‐[U+2010] Hyphen “连字符” - 通用标点
–[U+2013] En Dash - 通用标点
—[U+2014] Em Dash “一字线” - 数学算符
−[U+2212] Minus Sign “减号/负号” - 补充标点
⸺[U+2E3A] Two-em dash “破折号”
标点符号和码元之间的对应关系大概是:
- hyphen(连字符):在英文文本中用于连接英文单词。通常使用
-[U+002D] Hyphen-Minus,很少有人使用‐[U+2010] Hyphen。 - en dash:在英文文本中用于表示数字范围或比分。总是使用
–[U+2013] En Dash。 - em dash:在英文文本中用于表示停顿或解释说明。总是使用
—[U+2014] Em Dash。 - minus(减号/负号):表示减法。在语义和视觉效果上应当使用
−[U+2212] Minus Sign,但很多人使用-[U+002D] Hyphen-Minus;在编程语言中总是使用-[U+002D] Hyphen-Minus。 - 一字线:在中文文本中用于表示范围或起止,通常使用
—[U+2014] Em Dash “一字线”。 - 破折号:在中文文本中用于表示停顿或解释说明,通常连用两个
—[U+2014] Em Dash “一字线”,从语义上应当使用⸺[U+2E3A] Two-em dash “破折号”,但是从来没有人会这么用。
这里有一个问题:在中文文本中,表示数字范围应该使用— [U+2014] Em Dash “一字线”,但这种写法在英文文本中是错误的。而在英文文本中表示数字范围的– [U+2013] En Dash并不是《标点符号用法》中规定的中文标点。在混合排版中原则上应当根据语段选择合适的符号。

浙公网安备 33010602011771号