×

聚类分析。理论、FORTRAN程序、示例。Transl.公司。由约翰内斯·戈德施密特(Johannes Goldschmidt)从德语改编。 (英语) Zbl 0584.62094号

Ellis Horwood计算机及其应用系列。奇切斯特:Ellis Horwood Limited;奇切斯特等:霍尔斯特德出版社,约翰·威利父子公司分部。第226页,25.00英镑(1985年)。
[查阅1983年德文原版,请参阅Zbl 0536.62048号.]
这本关于聚类技术的书是作者个人长期反思和教学经验的结果,无可置疑。事实上,它从理论部分开始,通过一系列Fortran程序实现(第2部分),并以许多精心选择的示例结束(第3部分),为本主题提供了一种平衡的方法。
乍一看,这对于一本只有226页的书来说是一个很大的范围。幸运的是,所考虑的一组聚类技术并不包含所有已知方法。相反,与人们读到非常笼统的标题时所期望的不同,作者将自己局限于所谓的优化技术的一个相当小的类别,寻求优化目标函数,该目标函数涉及在固定数量的簇中直接划分对象。
然而,我们必须认识到,在选择专注于目标优化技术时,作者能够收集并提出一组连贯的定理和引理,为所开发的不同算法提供了坚实的基础。
主要基于矩阵代数的理论发展是最强大、最有效和最紧凑的,只有几个盲点。然而,一个普遍的缺点是所提出的不同方法背后缺乏更深层的统一原则。然而,毫无疑问,这第一部分将引起人们的极大兴趣,不仅对于纯粹的数学家,而且对于寻求发现解决其问题的最佳方法的实践者。
算法的实现直接从第一部分的问题解决方法中推导出来,采用大约30页Fortran清单的形式,夹在几页解释和注释之间。不同的程序被细分为一系列模块化子程序,允许根据个人的具体需要“点菜”安排程序。然而,必须对这些子程序的表示作出一些保留,这在一定程度上限制了它们的适用性。
不仅字母类型很小,可读性很差,而且列表中没有任何注释,既没有关于执行的操作,也没有关于变量定义的注释,这使得这些列表很难阅读。文本中的解释并不能完全弥补这一缺陷——当然,对于那些正在处理子程序并有准时问题的人来说,这是不可能的。然而,关于存储需求、发生的错误种类或某些常量必须调整的方式,也出现了其他问题:这些问题仍未得到回答。
至于示例程序,即本书第三部分的示例,它们从二维图形表示来看确实很吸引人;然而,它们的可读性甚至不如第二部分的程序清单。不仅大量打印输出的页面上有图表,漏掉了最基本的标题和图例,甚至文本的解释也很简约。
我的结论是,作者在他的书的第一部分中提出了一组非常有趣的理论发展,这是关于聚类分析的一个相当有限的部分。本书剩余部分显示的程序列表和示例将说服任何挑剔的读者,所提出的算法可以正常工作,并产生良好的结果。然而,对于这些程序的实际实施,最好直接与作者联系。
审核人:E.特劳瓦特

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
62-04 统计相关问题的软件、源代码等
62-02 与统计有关的研究展览(专著、调查文章)
65C99个 概率方法,随机微分方程
68吨10 模式识别、语音识别
62-07 数据分析(统计)(MSC2010)