跳到内容

mmp2/百万人

存储库文件导航

megaman:数百万分的多元学习

蟒蛇服务器徽章 生成状态 版本状态 许可证

百万富翁是一个可扩展的流形学习包,在蟒蛇。它有一个设计为熟悉的前端API科学知识学习但安全带近似最近邻的C++快速库(FLANN)和稀疏对称正定(SSPD)解算器局部最优块预编码梯度(LOBPCG)方法将流形学习算法扩展到大型数据集。在一台个人电脑上,megaman可以嵌入100万个数据点在10分钟内有数百个维度。megaman是为研究人员设计的,作为这样的缓存中介允许使用新参数快速重新计算的步骤和索引。

程序包文档可在http://mmp2.github.io/megaman/

如果您使用我们的软件,请引用以下JMLR论文:

McQueen、Meila、VanderPlas和Zhang,“Megaman:Python中的可伸缩流形学习”,《机器学习研究杂志》,第17卷,第14期,2016年。http://jmlr.org/papers/v17/16-109.html

您也可以在以下网址找到我们的arXiv论文http://arxiv.org/abs/1603.02763

示例

Google Colab中的安装和示例

下面是通过Conda环境在Google Colab上安装megaman的教程。

它还提供了使用megman在均匀瑞士卷数据集上构建光谱嵌入的教程。

Conda安装

由于API的变化,$conda安装-c conda锻造巨人不再支持。我们目前正在修复该错误。

请参阅下面的完整安装说明进行构建百万富翁来源。

从源安装

要从源安装megaman,需要以下操作:

可选要求包括

可以使用以下conda命令在Linux和MacOSX上安装这些要求:

$conda创建-n manifold_env python=3.5-y#也可以使用python=2.7或python=3.6$来源激活manifold_env$conda安装--channel=conda-forge-y pip nose coverage cython numpy scipy\scikit-learn pyflann pyamg h5py plotly科基特学院

克隆此存储库并光盘到源存储库

$光盘/临时管理计划/$git克隆https://github.com/mmp2/megaman.git$光盘百万富翁

最后,在源存储库中,运行此命令以安装百万富翁程序包本身:

$python setup.py安装

单元测试

megaman使用鼻子用于单元测试。使用鼻子已安装,类型

$make测试

运行单元测试。百万富翁在Python版本2.7、3.4和3.5上进行了测试。

作者

其它责任者

未来的工作

请参阅此问题列表,了解我们对即将发布的版本的计划:

未来的工作