为什么人名会忽略某些unicode字符?

由于早期的技术限制数据库许可证,中的名称数据库许可证仅限于ISO/IEC 8859-1(拉丁语-1)字符集。这包括像ä、é、èñ、ó、ç等字符,但不包括像?、?,œ, Ž, ... 我们尝试将所有人名音译为latin-1,方法是将不支持的字符替换为最接近的latin-1匹配项(例如,“?”作为“s”,“œ”作为“oe”,“Zh”作为“Z”等)。对于我们网站上显示的书目元数据信息以及每个作者页面的标题来说,情况尤其如此。

然而,如果我们知道作者姓名的完整Unicode表示,我们现在可以将Unicode名称作为注释添加到作者页面。请理解,这只能通过手动编辑作者记录才能实现,在大多数情况下,我们只是不知道名称的真正Unicode转录(例如,在亚洲名称的上下文中)。

以下列表包含在中实现的所有特殊字符数据库许可证:

À Á Â Ã Ä Å Æ Ç È É Ê Ë Ì Í Î ÏÐ Ñ Ò Ó Ô Õ Ö Ø Ù Ú Û Ü Ý Þ ßà á â ã ä å æ ç è é ê ë ì í î ïð ñ ò ó ô õ ö ø ù ú û ü ý þ ÿ