关于排版和字符集

关于引号

和句点/句号、逗号、问号、感叹号等标点符号不同,中英文的单双引号使用的是同一组Unicode码元:

  • [U+201C] Left Double Quotation Mark “左双引号”
  • [U+201D] Right Double Quotation Mark “右双引号”
  • [U+2018] Left Single Quotation Mark “左单引号”
  • [U+2019] Right Single Quotation Mark “右单引号”

这导致在混合排版过程中,即使分别指定了中英文语言字体,引号的字形也必须要考虑所在文本块的语言设置才能正确呈现。在Web中,必须显式设置字体才能在对应的语段使用正确的字形。

<span style="font-family:SimSun, 'Times New Roman'">他说:“Hello World”</span>
<span style="font-family:'Times New Roman', SimSun">He said, “你好世界”</span>

他说:“Hello World”
He said, “你好世界”

在Word中,对于支持多语种字体的文本(例如希腊字母、引号等),除了手动设置字体之外,还可以通过设置对应语段的语言来以自动适配字形。只要将选中文本将语言改为英语(美国),之后再通过输入插入希腊字母或引号时就会自动使用西文字体。

顺带一提,Unicode并没有提供全角弯引号。其中收录的 [U+FF02] Fullwidth Quotation Mark “全角引号”和 [U+FF07] Fullwidth Apostrophe “全角撇号”是ASCII字符" [U+0022] Quotation Mark “引号/直双引号”和' [U+0027] Apostrophe “撇号/直单引号”的全角化,后两者是编程语言中的引号符。这四个符号在中英文印刷排版领域均不是规范的标点。

关于横线:minus, hyphen, endash, emdash和破折号

在中英文印刷排版领域,有几种标点符号以横线的形式呈现,分别是hyphen(连字符)、en dash、em dash、minus(减号)、一字线和破折号。

与之相关的Unicode码元包括:

  • ASCII符号 - [U+002D] Hyphen-Minus “短横线”
  • 通用标点 [U+2010] Hyphen “连字符”
  • 通用标点 [U+2013] En Dash
  • 通用标点 [U+2014] Em Dash “一字线”
  • 数学算符 [U+2212] Minus Sign “减号/负号”
  • 补充标点 [U+2E3A] Two-em dash “破折号”

标点符号和码元之间的对应关系大概是:

  • hyphen(连字符):在英文文本中用于连接英文单词。通常使用- [U+002D] Hyphen-Minus,很少有人使用 [U+2010] Hyphen。
  • en dash:在英文文本中用于表示数字范围或比分。总是使用 [U+2013] En Dash。
  • em dash:在英文文本中用于表示停顿或解释说明。总是使用 [U+2014] Em Dash。
  • minus(减号/负号):表示减法。在语义和视觉效果上应当使用 [U+2212] Minus Sign,但很多人使用- [U+002D] Hyphen-Minus;在编程语言中总是使用- [U+002D] Hyphen-Minus。
  • 一字线:在中文文本中用于表示范围或起止,通常使用 [U+2014] Em Dash “一字线”。
  • 破折号:在中文文本中用于表示停顿或解释说明,通常连用两个 [U+2014] Em Dash “一字线”,从语义上应当使用 [U+2E3A] Two-em dash “破折号”,但是从来没有人会这么用

这里有一个问题:在中文文本中,表示数字范围应该使用 [U+2014] Em Dash “一字线”,但这种写法在英文文本中是错误的。而在英文文本中表示数字范围的 [U+2013] En Dash并不是《标点符号用法》中规定的中文标点。在混合排版中原则上应当根据语段选择合适的符号。

posted @ 2026-01-30 00:35  Fan-iX  阅读(0)  评论(0)    收藏  举报