×

产品驱动的数据挖掘。 (英语) Zbl 1101.68510号

作者的结论:对于给定的产品,需要完成两项任务。第一个是识别对产品有好感的消费者,第二个是推断与这些消费者有关的其他特征。
这是通过双重战略实现的。通过对所有因素的平均值差异进行排序,可以确定最能反映有利消费者特征的问题。一旦确定,数据挖掘可用于估计特定策略的威力,以正确识别特定个人。对于案例研究A,识别算法只是使用个人的家庭价值。通过优化截止水平,这个单一变量能够正确识别数据挖掘中41%的个体。通过综合使用问题,可以提高这一百分比。执行基于这些关键识别问题的聚类分析可以推断出这些消费者的其他特征。
这两个案例研究表明,能够识别出在特定产品方面显著区分受访者的问题是该过程的一个基本部分。未能进行此识别会降低后续聚类分析的分辨率。案例研究A说明了产品存在明显分离的情况,而案例研究B说明了不存在明显分离时分辨率降低的情况。通常,第一步可能取决于数据类型和所需的差异。由于数据挖掘的潜在特征结构,将因子分析与基本测试统计中的差异考虑相结合,证明优于基于潜在变量或主成分的方法。
为了提高这种方法的能力,未来的发展应该包括更复杂的聚类算法。例如,PLS/SVD可以用于第一步分离后的聚类子组,并使用均值统计差异。此外,还应解决一组特定识别问题的识别能力的自动确定问题。

MSC公司:

第68页,共15页 数据库理论
PDF格式BibTeX公司 XML格式引用