类别理论家的机器学习工作| n类咖啡馆

2024年4月10日

类别理论者的机器学习工作

发布人：John Baez

前特斯拉工程师乔治摩根已经成立了一家名为Symbolica公司利用范畴理论改进机器学习。

当马斯克和他的人工智能主管安德烈·卡佩西（Andrej Karpathy）不听摩根（Morgan）的担忧，即当前的深度学习技术无法“扩展到无限并解决所有问题”时，摩根离开了特斯拉（Tesla），创办了Symbolica。亿万富翁维诺德·科斯拉（Vinod Khosla）给了他200万美元，以证明类别理论的想法可能有所帮助。

科斯拉后来说：“他说得很可信。所以我们说，‘去雇佣范畴理论领域最优秀的人。’”他说，虽然他仍然相信OpenAI在构建大型语言模型方面的持续成功，但他对摩根的想法“相对乐观”，这将是一个“重大贡献”如果它按预期工作，则发送给AI。所以他又投资了3000万美元。

不用说，这引发了很多问题。一些类别理论家担心炒作。我更担心的是，如果这项技术真的奏效了，会发生什么！

但也许最直接的问题是，Symbolica正在聘请类别理论家。它已经雇佣了一些人，而且这里有6个以上的招聘广告。他们正在英国和澳大利亚招聘员工。

若范畴理论家在这一领域找到了工作，他们还不如阅读n个-品类咖啡馆。以下是这6个职位-您可以在链接中看到更详细的描述：

关于数学的更多信息，看看这些文件.

发布于2024年4月10日下午4:29 UTC

此条目的TrackBack URL:https://golem.ph.utexas.edu/cgi-bin/MT-3.0/dxy-tb.fcgi/3524

6条评论和0条回溯

关于：类别理论者的机器学习工作

$支持MathML的帖子（单击以获取更多详细信息）。$

他们知道这听起来有多愚蠢吗？

“当前的深度学习技术无法“扩展到无限大并解决所有问题，”

科斯拉后来说：“他说得很可信。所以我们说，‘去雇佣这个范畴理论领域最优秀的人。’”

发布人：zzz于2024年4月10日9:19 PM|永久链接|对此的答复

关于：类别理论者的机器学习工作

$支持MathML的帖子（单击以获取更多详细信息）。$

为了防止不清楚，“他说得很可信”并不是指摩根说“当前的深度学习技术无法扩展到无限大并解决所有问题”，而是指摩根和他的研究团队如何制定计划，在人工智能中使用范畴理论。

发布人：约翰·贝兹2024年4月10日11:35 PM|永久链接|对此进行答复

关于：类别理论者的机器学习工作

$支持MathML的帖子（单击以获取更多详细信息）。$

也许你需要解释一下什么是愚蠢的部分

发布人：米切尔·波特，2024年4月11日12:00 AM|永久链接|对此的答复

关于：类别理论者的机器学习工作

$支持MathML的帖子（单击以获取更多详细信息）。$

现实世界中的任何事物都无法扩展到无穷大。

“雇佣这个领域最好的人……”是MBA的说法，因为我不知道这个项目到底是什么。

发布人：zzz于2024年4月11日凌晨1:05|永久链接|对此进行答复

关于：类别理论者的机器学习工作

$支持MathML的帖子（单击以获取更多详细信息）。$

引言中没有很多细微差别，但神经网络体系结构的样本复杂性是一个经过深入研究的问题，它有效地回答了这个问题：有效地学习一项任务需要多少数据点。

当涉及到某些类型的任务（即组操作）时，像变形金刚这样的架构会设法学习适当的等方差（请参阅https://arxiv.org/abs/2210.02984)。对于其他的（即内函子的初始/最终余代数，它们是结构化（co）递归的范畴语义），它们失败了（参见https://arxiv.org/abs/2305.14699或https://arxiv.org/abs/2402.05785)。

因此，事实上，扩展神经网络是一个大问题，许多资金/资源正被用于努力做好这件事，正如今天的LLM数量所表明的那样。几乎毫无例外，算法/结构化学习任务是在没有严格定义这些算法或结构的情况下进行的。

发布人：Bruno Gavranovic于2024年4月11日下午6:35|永久链接|对此的答复

关于：类别理论者的机器学习工作

$支持MathML的帖子（单击以获取更多详细信息）。$

你好，约翰，

谢谢你分享工作公告。我们正在开始一些非常令人兴奋的事情，作为团队的研究负责人，我们——Paul Lessard和Bruno Gavranović——认为我们会提供澄清。

Symbolica不是起动利用范畴理论改进ML。相反，Symbolica成立于约2年前，其200万种子基金旨在解决符号推理问题，但当时，它实现这一目标的途径并不是通过分类深层学习（CDL）。最初的计划是使用超图重写作为提高学习效率的手段。然而，这种方法最终被证明是不可行的。

Symbolica大约五个月前开始转向CDL。布鲁诺刚刚完成了他的博士论文，为这一主题奠定了基础，我们将组织的大部分工作转向了这一研究方向。特别是，我们开始：a）完善开发和应用CDL的路线图，以及b）与谷歌DeepMind的研究人员合作撰写一份立场文件，你在下面引用了这篇文章。

在过去的几个月里，我们对适用性的预感实际上是令人兴奋和可行的研究方向。我们已经取得了惊人的进展，甚至进行了我们计划在上述立场文件中倡导的一些研究。真的，我们发现了认真对待类别在深度学习领域能给你带来多少好处。

DL的许多进步都是关于创建识别数据中健壮和通用模式的模型（例如，请参阅Transformers/Attention机制）。从很多方面来说，这正是CT的意义所在：它是许多科学家（包括我们自己）了解我们周围世界不可或缺的工具：在数据中找到可靠的模式，同时也可以交流、验证和解释我们的推理。

与此同时，Symbolica的研究工程团队在实现一个特定的深度学习模型方面取得了显著、独立和具体的进展，该模型对文本数据进行操作，但不像大多数GPT风格的模型那样以自回归的方式进行操作。

这些进展向维诺德和其他投资者发出了关键信号，导致3100万美元融资回合的结束。

我们现在正在开发一个将二者结合起来的研究项目，利用结构理论的见解，例如范畴代数，作为形式化我们的过程的手段找到数据中的结构。这有双重后果：推动模型识别数据中更稳健的模式，但也有可解释和可验证的模式。

综上所述：

a）正如该帖子可能暗示的那样，推动应用范畴理论并不是基于一种奇想，

但事实并非如此

b） Symbolica正在开发一个严肃的研究项目，致力于将范畴理论应用于深度学习，而不仅仅是雇佣范畴理论家

所有这些都是为了增加额外的背景，以评估公司、其团队和我们的方向，这在最近出版的技术文章中没有出现。

我们强烈鼓励感兴趣的各方查看所有的招聘广告，这些广告都是我们根据特定角色定制的。大致上，在CDL团队中，我们正在寻找

1）在范畴理论方面的专业知识，以及对深度学习的强烈兴趣，或

2）在深度学习方面的专业知识，以及对范畴理论的浓厚兴趣。

所有级别的资历。

很高兴回答任何其他问题/想法。

Bruno Gavranović，

保罗·莱萨尔

发布人：Bruno Gavranovic，2024年4月11日下午4:57|永久链接|对此的答复

n类咖啡馆

跳到主要内容

2024年4月10日

类别理论者的机器学习工作

发布人：John Baez

6条评论和0条回溯

关于：类别理论者的机器学习工作

关于：类别理论者的机器学习工作

关于：类别理论者的机器学习工作

关于：类别理论者的机器学习工作

关于：类别理论者的机器学习工作

关于：类别理论者的机器学习工作

访问密钥：

n类咖啡馆

跳到主要内容

2024年4月10日

类别理论者的机器学习工作

发布人：John Baez

一些相关条目

6条评论和0条回溯

关于：类别理论者的机器学习工作

关于：类别理论者的机器学习工作

关于：类别理论者的机器学习工作

关于：类别理论者的机器学习工作

关于：类别理论者的机器学习工作

关于：类别理论者的机器学习工作

访问密钥：