跳到主要内容

色彩感知的几何学。第1部分:均匀颜色空间的结构和度量

摘要

这是一篇由两部分组成的论文的前半部分,涉及色彩感知的几何。在这里,我们详细分析了H.L.Resnikoff 1974年的开创性工作,他表明在感知颜色空间上只有两种可能的几何结构和黎曼度量\(\数学{P}\)与Schrödinger的公理集兼容,完成了同质性假设。我们将Resnikoff的模型重铸为一个更现代的色度设置,为原始论文的主要结果提供了一个更简单的证明,并激发了心理物理实验的需要,以混淆或确认背景变换的线性,这些背景变换在\(\mathcal{P}\)最后,我们表明,Resnikoff通过背景变换下不变性公理挑选出的黎曼度量与锐化效应不兼容,因此需要进一步研究感知颜色度量。

1简介和最新技术

这篇由两部分组成的论文的前半部分对H.L.Resnikoff在论文中开发的颜色感知方面的开创性工作进行了全面回顾和批判性分析[1]和这本书[4]. 这些工作是色度学重建现代计划的主要灵感之一,该计划将在第二部分中讨论,其中将展示如何通过Jordan代数的框架在量子理论中重建Resnikoff的模型。

即使乍一看可能令人惊讶,莱斯尼科夫还是属于数学家、物理学家、生物学家、哲学家,甚至是对颜色概念着迷的诗人的一个庞大的群体。这个名单令人印象深刻,从柏拉图到维特根斯坦,经历了亚里士多德、笛卡尔、胡克、牛顿、欧拉、杨、亥姆霍兹、麦克斯韦、格拉斯曼、黎曼、歌德、叔本华、洛克、韦伯、费奇纳、道尔顿、赫林,最后但并非最不重要的是薛定谔(参见例如[5]对于薛定谔色彩作品的现代翻译)。

事实上,正是对光学和颜色之间的数学类比以及量子粒子的振荡行为的研究,使得薛定谔提出了在量子力学中以他的名字命名的著名方程[6]. 这将在门派中被召回。 2,薛定谔在一组连贯的公理中综合了色彩感知数学理论的最重要发现,并介绍了他自己的一个发现。这可以被认为是麦克斯韦对电磁学所做的心理-物理对应。

Wright和Guild的实验,参见例如[7],本可以为颜色感知的数学理解的进一步发展铺平道路;然而,当时刚刚成立的国际照明委员会(CIE)走了一条更实用的道路,建立了几何平面的颜色空间,其优点是便于工程处理。虽然XYZ空间今天仍然是色度学的一个方便的颜色空间,但它直到最近几年才得到发展,参见[8],缺乏数学严谨性,并引入了特别参数,以使新发现的现象适应现有的颜色空间结构,而不是修改其几何结构以适应新的观测结果。

相反,Resnikoff的论文和书籍对色彩空间的平面几何提出了质疑。它们写于20世纪70年代中期,大约与相对论量子场论的研究人员开发标准模型当人们首次尝试将量子力学和广义相对论融合为一个单一理论时。这个时代精神可以解释为什么Resnikoff决定使用理论物理中非常常见的技术(如黎曼几何、齐次空间、李群和代数)来研究颜色感知。从这个意义上说,他的成就可以被视为“理论心理物理学”的一个非常优雅的例子。

尽管雷斯尼科夫的工作极具独创性和深度,但直到今天,他的工作几乎都没有引起人们的注意,这可能是因为理解他的发现的意义所需的数学知识相当广泛,不属于从事色度学研究的科学家的典型数学背景。

本文的目的之一是用更现代和教学的术语重写Resnikoff的结果,从而使色度学、视觉科学和图像处理领域的更广泛研究人员能够使用这些结果。

我们将详细讨论感知颜色空间的同质性公理\(\mathcal{P}\)这使得Resnikoff表明,如果我们接受同质性假设,\(\mathcal{P}\)只能是色度学家所熟知的标准Helmoltz–Stiles空间,或者是一个全新的双曲线空间。我们将对此结果提供另一种更简单的证明,并强调Resnikoff在年提出的原始证明中的一个错误[1]。

与标准色度设置不同,雷斯尼科夫在我们今天所说的中建立了他的理论上下文中的颜色即嵌入均匀背景中的颜色刺激。这一方面似乎对他的理论的发展至关重要,因为这组变换是在其上起过渡作用的\(\mathcal{P}\)通过背景变化识别。然而,我们注意到,一个主要问题仍然悬而未决:背景变换必须是线性的,才能符合雷斯尼科夫的理论,但目前还没有实验数据来证实或证实这一假设。因此,我们将讨论一个心理物理实验,该实验可用于验证背景变换的线性。

最后,我们将证明,这种锐化效应与Resnikoff的假设相矛盾,即背景变化相对于感知颜色度量是等距的。因此,需要进一步研究感知颜色度量。

2薛定谔感知颜色空间公理述评

薛定谔关于感知颜色空间的公理可以用以下语句来恢复:感知颜色空间是嵌入在维小于或等于3的实向量空间中的规则凸锥.

然而,这句话的有效性是在色度学标准观测条件的限制范围内,正如我们将要讨论的,这是非常严格的,与自然视觉场景相去甚远。

我们从本文其余部分所需的符号和术语开始。

  • \(\varLambda=[\lambda_{text{min}},\lambda{text{max}}]\)表示视觉光谱,的极值Λ由于它们的数值不重要,并且没有达成一致,因此未指定。通常,人们会选择\(lambda{text{min}}=380\mbox{nm})(极紫)和\(\lambda_{\text{max}}=780\mbox{nm}\)(极度红色)。

  • \(\textbf{x}:\varLambda\to\mathbb{R}^{+}\):是表示与颜色刺激物理光.A型光谱颜色刺激 \(\textbf{x}_{\lambda_{0}}(\lambda)\)相对于波长\(\lambda_{0}\)是一种窄带可见辐射,通常由以\(\lambda_{0}\)并且具有较小的标准偏差(通常为1nm量级),或者在Λ除了包含\(\lambda_{0}\).

  • 由于光刺激具有有限的能量,即。\(\int_{\varLambda}\textbf{x}(\lambda)^{2}\,d\lambda<+\infty\),物理光可以被视为\(L^{2}(\varLambda)\子集L^{1}(\ varLambda)\),其中包含成立是因为Λ是有限的。光刺激是实值的,所以\(L^{2}(\varLambda)\)将被视为一个实向量空间,我们将写

    $$L_{+}^{2}(\varLambda)=\bigl\{x:\varLambeda\到[0,+\infty),x\在L^{2{(\valLambda,\bigr\}中$$
    (1)

    对于颜色刺激的空间。

  • 标准比色观测条件:在传统测试中,物理光x个显示在昏暗的房间孔径角为2度(中心凹视野)或10度(中心外视野)的观察者。正如我们将在门派中看到的那样。 3.2,Resnikoff没有考虑这种标准观测条件,因为在他的模型中,x个在均匀照明的背景下,显示为一个较小的中心区域。在后一种情况下,我们在(统一)上下文中讨论颜色。关于非均匀背景下颜色的实验仍然很少见,例如[910]并且局限于一个非常简单的几何结构,远离自然场景的复杂性。在本节中,只考虑标准色度观测条件。

  • 颜色匹配:比较两种物理光感知的典型方法\(L_{+}^{2}(\varLambda)中的\textbf{x},\textbf{y})将视野分为两部分(创建一个二分场)并排放置两种颜色的刺激物。x个据说比赛如果他们之间看不到边缘。我们强调,这并不是感知比较颜色刺激的唯一方法,但对于上述标准色度观察条件而言,这更为常见。

  • 对于任何\(L_{+}^{2}(\varLambda)中的\textbf{x},\textbf{y}),我们写\(\textbf{x}\sim\textbf{y}\)意思是x个被认为是相同的脚注1在配色实验中。我们在写表达式时强调这一点\(\textbf{x}\sim\textbf{y}\),颜色刺激x个显示了在一侧二分域和 在另一边。符号的位置很好,因为确实是一个等价关系[11]。

  • 这个感知色彩的空间在标准色度学中,观察条件被定义为相等感知光的一组等价类,即商空间

    $$\mathcal{P}=L_{+}^{2}(\varLambda)/{\sim}$$
    (2)

    的等价类x个将简单地表示为x个:

    $$x=[\textbf{x}]_{\sim}$$
    (3)

    鉴于\(x,y\ in \ mathcal{P}\)\(x=y)方法\([\textbf{x}]{\sim}=[\textbf{y}]{\sim}\)\(\textbf{x}\sim\textbf{y}\),所以平等 \(\mathcal{P}\) 表示颜色刺激的感知匹配。的0\(\mathcal{P}\)是所有物理灯光的等效类别,这些灯光太暗以至于被视为黑色。

  • 我们可以捐赠\(\mathcal{P}\)通过以下操作总和正实标量的乘法。对于任何\(L_{+}^{2}(\varLambda)中的\textbf{x},\textbf{y})和任何正标量\(\lambda\in\mathbb{R}^{+}\)\(\textbf{x}+\textbf{y}\)被解释为光束和λx个作为强度调制x个按因子计算λ。这些操作定义于\(升^{2}_{+}(\varLambda)\)可以传递到商空间\(\mathcal{P}\)只需定义

    $$\lambda_{1}x+\lambda_{2}y=[\lambda_{1{x}+\lampda_{2{y}]{\sim},\quad\forall\lambda{1},\ lambda_{2}\in\mathbb{R}^{+},\forall\textbf{x},\textbf{y}\inL_{+}^{2}(\varLambda)$$
    (4)

    所以\(z=[\textbf{z}]{\sim}\)可以写成\(z=λ{1}x+λ{2}y)当且仅当\(\textbf{z}\sim\lambda{1}\textbf{x}+\lambda{2}\textbof{y}\).Dubois于年证明[11]也就是说,如果我们考虑色度学的标准观测条件,这些操作在某种意义上是明确定义的,即它们不依赖于知觉等价类中代表的选择。要继续,请在中\(\mathcal{P}\)可以操作圆锥形的感知颜色的组合,即具有正实系数的线性组合。特别是\(\mathcal{P}\)即,系数总和为1的圆锥组合得到了很好的定义。

  • 包含以下内容的最小向量空间\(\mathcal{P}\)

    $$V=\mathcal{P}-\mathca{P}=\{x-y,x,y\in\mathcal{P}\}$$
    (5)

    参见示例[12]. 的元素V(V)写为−,使用\(y\in\mathcal{P}\),将被调用虚拟颜色为了理解虚拟颜色在色度学中的作用,值得回顾著名的莱特和吉尔德实验,参见[7]或[8],这表明,对于固定的颜色刺激\(z\单位:L^{2}_{+}(\varLambda)\),有三个光谱颜色刺激\(L中的\textbf{x}、\textbf{y}、textbf{w}^{2}_{+}(\varLambda)\)和三个实正系数\(a,b,c\in\mathbb{R}^{+}\)这样\(a\textbf{x}+b\textbf{y}+c\textbf-{w}\sim\textbv-{z}\)\(a\textbf{x}+b\textbf{y}\sim\textbf{z}+c\textbf{w}\)在最后一种情况下,通过回顾上述公约,我们必须叠加z(z)具有c(c)w个在二分域的一侧对叠加进行颜色匹配\(a\textbf{x}+b\textbf{y}\)在另一边。这就是虚拟颜色发挥作用的地方:给定\(x,y,w,z\in\mathcal{P}\)\(a,b\in\mathbb{R}^{+}\)、和\(c<0)\(z=ax+by+cw)属于V(V)但不是为了\(\mathcal{P}\),因为c(c)为负值。色度学解释如下:颜色刺激\(a\textbf{x}+b\textbf{y}\)在二分域匹配的一侧向观察者显示\(\textbf{z}+(-c)\textbf{w}\)显示在另一侧,即。\([\textbf{z}+(-c)\textbf{w}]{\sim}中的a\textbf2{x}+b\textbf2{y}\).

有了这个符号,薛定谔的公理,请参见[13],可以这样说。

  • 公理1(牛顿1704[14])如果\(x\in\mathcal{P}\)\(\alpha\in\mathbb{R}^{+}\),然后\(\alpha x\in\mathcal{P}\).

  • 公理2(薛定谔1920[13])如果\(x\in\mathcal{P}\)\(x\neq0),则不存在任何\(y\in\mathcal{P}\)\(y\neq0)这样的话\(x+y=0).

  • 公理3(格拉斯曼1853[15]&亥姆霍兹1866[16])对于每个\(x,y\in\mathcal{P}\)并且对于每个\([0,1]\中的alpha\)\(αx+(1-\alpha)y\in\mathcal{P}).

  • 公理4(Grassmann 1853[15])对于所有四倍的感知光\(x_{k}\in\mathcal{P}\)\(k=1,\ldots,4\),有系数\(\alpha_{k}\in\mathbb{R}\)并非同时为空,因此\(\sum_{k=1}^{4}\alpha_{k}x{k}=0\).

现在让我们讨论公理的色度学和数学意义。混合Axioms 1、2和4将获得Axiom4的更精细版本;此外\(\mathcal{P}\)将根据公理1和公理3加下划线。

从数学上讲,公理1的含义很简单:\(\mathcal{P}\) 是一个无限圆锥体嵌入V(V)。但是,请注意,这是一个理想化:何时α变得非常大,感光器饱和,直到达到眩光极限,我们失去视觉能力。相反,作为α变小后,我们进入中间层或暗区条件,在该条件下,锥体和杆或仅杆分别被激活。如果α接近0时,我们就失去了视觉能力。因此,圆锥体\(\mathcal{P}\)从上方和下方截断,从明视状态转换为暗视状态(所谓的普金野效应[7])从数学和色度学的角度来看,这仍然是一个重大挑战。对这些重要问题的讨论值得一篇论文,在这里我们只考虑\(\mathcal{P}\)作为一个无限圆锥体。

公理2意味着,与0不同的感知颜色的叠加不会被视为无光。脚注2从数学上讲,这意味着圆锥体\(\数学{P}\)有规律的(也说适当的).

公理3表示连接感知颜色的线段x个完全由感知的颜色组成,因此公理1、2和3共同意味着\(\mathcal{P}\) 是一个规则的凸锥公理3在锥-凸组合(即正系数介于0和1之间且总和为1的线性组合)下等价于闭合。

这一事实,连同Axiom 1,意味着\(\mathcal{P}\)实际上是关闭实际上,在圆锥组合下\(\alpha_{1},\alpha_2}\在\mathbb{R}^{+}\中)\(x_{1},x_{2}\in\mathcal{P}\)\(\压裂{1}{\α{1}+\α{2}}(\α_{1} x个_{1} +\阿尔法_{2} x个_{2} )\equiv z\)是以下元素的凸组合\(\mathcal{P}\),所以\(z\in\mathcal{P}\)感谢Axiom 3,但同时\((alpha{1}+\alpha{2})z=\alpha_{1} x个_{1} +\阿尔法_{2} x个_{2} \in\mathcal{P}\)感谢Axiom 1。通过迭代这个参数,我们得到了\(sum{k=1}^{n}\alpha{k}x{k}\in\mathcal{P}\) \(对于所有\alpha_{k}\in\mathbb{R}^{+}\)\(x_{k}\in\mathcal{P}\)\(k=1,\ldots,n\).

公理1和公理3意味着\(\mathcal{P}\) 是一个连通且可收缩的圆锥体\(\mathit{标识}_{\mathcal{P}}\)与常量映射同伦[17]. 直觉上,这意味着\(\mathcal{P}\)可以连续收缩到一个点。这句简单的话对分析\(\mathcal{P}\).

Axiom 4意味着每一个超过三种感知颜色的集合都是一个线性相关的家族V(V).

通过以下参数可以获得Axiom 4的更精细版本。首先,请注意公理1-3防止\(\字母{k}\)s来自所有相同的符号。事实上,让我们假设所有系数\(\alpha_{1}、\ldot、\alpha_{4}\)是肯定的,那么\(\bar{x}=\sum_{k=1}^{3}\alpha_{k}x{k}\in\mathcal{P}\)(多亏了刚刚证明的事实)和\(\bar{y}=\alpha_{4}x{4}\in\mathcal{P}\)(感谢Axiom 1),然后\(\sum_{k=1}^{4}\alpha_{k}x{k}=0\)暗示\(\bar{x}+\bar{y}=0\),这是由公理2阻止的。当所有系数\(\alpha_{1}、\ldot、\alpha_{4}\)为负值。

继续,Axioms 1-4表示Axiom 4的这个更强版本。

  • 公理4'对于所有四倍的感知光\(x_{k}\in\mathcal{P}\)\(k=1,\ldots,4\),有系数\(\alpha_{k}\in\mathbb{R}\)不是所有人都有相同的标志,因此\(\sum_{k=1}^{4}\alpha_{k}x{k}=0\).

只有两个选项与Axiom 4'一致。第一种选择是三个系数具有相同的符号,而剩下的一个具有相反的符号V(V)是颜色匹配,而负系数意味着相应的光刺激必须显示在二分场的另一侧,这意味着一个光刺激颜色匹配其他三个光刺激的叠加。

在第二个选项中,两个系数为正,两个为负:这意味着两个灯光刺激的叠加颜色与其他两个灯光激励的叠加颜色相匹配。因此,我们看到薛定谔的公理与赖特和吉尔德的实验是一致的[8]。

Axiom4的另一个直接后果是V(V)为1、2或3。特别是,我们要求观察员:

  • \(\操作员姓名{dim}(V)=3\):三铬酸盐;

  • \(\操作符名{dim}(V)=2\):重铬酸盐;

  • \(\操作符名{dim}(V)=1\):单色的;

  • \(\operatorname{dim}(V)=0\):失明的.

以下内容[18],我们观察到投影地图

$$\开始{aligned}\pi:L_{+}^{2}(\varLambda)&\longrightarrow\mathcal{P}\\textbf{x}&\longmapsto x\end{aligned}$$
(6)

意味着无数光谱不同的光在感知上重合.

在下文中,我们将只关注三色情况,即。\(\操作员姓名{dim}(V)=3\)所以,从现在开始,\(\mathcal{P}\) 将被解释为嵌入三维实向量空间中的规则凸锥.

Resnikoff的同质性公理\(\mathcal{P}\)

正如引言中所述[1]Resnikoff使用齐次空间理论研究感知颜色空间的几何和度量\(\mathcal{P}\)。这远不是一项微不足道的任务,因为构成\(\数学{P}\)从数学角度很难描述。因此\(\mathcal{P}\)它绕过了这些等价类的使用,这是非常可取的。

理解为什么Resnikoff在分析\(\mathcal{P}\)是一个关键点。因此,值得重温一下关于齐次空间的基本信息。

如果X(X)是一个非空集,并且G公司是一个组,然后是一张地图\(eta:G\乘以X\到X\)\((x,g)\映射到g(x)\)据说是的左动作G公司X(X)如果\(e(x)=x)e(电子)是…的中性元素G公司,如果\((gh)(x)=克(h(x))为所有人\(g,h\单位:g\)\(x中的x)在这种情况下,X(X)称为G公司-空间。如果我们解决了任何问题,然后是地图\(\ta_{g}:X\到X\)\(x映射到g(x))是双向的,它的反义词是\(\eta_{g^{-1}}\),因为\(g(x)\mapstog^{-1}(g(x))=e(x)=x\)那么,左边G公司上的操作X(X)可以等价地定义为群同态\(G\到\运算符名称{Aut}(X)\),其中\(\操作符名{Aut}(X)\)是上所有自同构(一对一函数)的组X(X).任何元素\(g中的g)称为对称对于X(X).

\(\mathcal{P}\)它不仅是一个集合,而且是嵌入向量空间中的凸锥,我们更感兴趣的是G公司-具有内在结构的空间。在这种情况下,我们打电话给X(X)G公司-空格,如果元素G公司保留…的结构X(X)即,如果\(\运算符名称{Aut}(X)\)是类别的自同构组,其中X(X)例如,拓扑空间的同胚、光滑流形的微分同胚、向量空间的可逆线性映射等等。

固定任意\(x中的x),集合\(G\cdot x=\{G(x)\in x:G\in G\}\)被称为G公司-的轨道x个.X(X)据说是一个G-齐次空间如果\(G\cdot x=x\)对于每个\(x中的x)即,如果G公司X(X)是可传递的。在这种情况下,对于每对元素\(x中的x,y\),存在转换\(g中的g)这样的话\(g(x)=y)这解释了为什么同质性的概念被称为数学术语这个空间没有一点是特别的.如果\(Y\子集X\),然后定义组\(\operatorname{Aut}(Y)=\{\varphi\in\operator name{Aut}(X):\varphi(Y)=Y\}\)的自同构X(X)仅限于Y(Y)成为…的自同构Y(Y),然后Y(Y)G-同质如果由群同态定义的动作\(G\到\运算符名称{Aut}(Y)\)在上是可传递的Y(Y).

让我们将其应用于我们感兴趣的情况,即一般锥的情况\(\数学{C}\)嵌入实向量空间V(V)有限尺寸n个在这种情况下,如果我们定义\(\operatorname{GL}(\mathcal{C})=\{T\in\operator name{GL{(V),T(\mathcal{C{)=\ mathcal}\}\),然后\(\数学{C}\)据说是一个均质锥体 V(V)如果,对于任意两点\(a,b\ in \ mathcal{C}\),存在\(T\in\operatorname{GL}(\mathcal{C})\)这样的话\(b=T(a)\)。我们还需要此属性的本地化版本:\(\mathcal{C}\)是一个局部均匀锥 V(V)如果,对于每个\(C\中的a\),有一个开放的社区\(U_{a}\)属于这样,对于每一个\(b\在U_{a}\中),存在\(T\in\operatorname{GL}(\mathcal{C})\)这样的话\(b=T(a)\),其中open指的是\(\mathcal{C}\)继承人V(V).

3.1学习的一维动机\(\mathcal{P}\)作为同质空间

Resnikoff宣称学习的动机\(\mathcal{P}\)齐次空间来源于对韦伯-费希纳定律的分析[7]以公制表示。韦伯-费希纳定律,通常被描述为有史以来确定的第一个心理物理定律,描述了人类对消色差刺激即仅取决于其强度的视觉输入(通常通过仅用昏暗的光激活视网膜杆来获得)。实验表明,非彩色强度刺激的知觉对应物\(x\in\mathbb{R}^{+}=(0,+\infty)\),已调用亮度并用表示\(b(x)\),与对数成正比x个(适用于各种强度)。因此,相对亮度\(b(x{1})-b(x{2})\)在两个强度的视觉刺激之间\(x_{1}\)\(x{2}\)与…成比例\(\log(x{1})-\log对于所有正系数λ属于韦伯-费奇纳定律有效的值范围。这就解释了为什么相对亮度在同时修改由

$$x_{1}\mapsto\lambda x_{1},\qquad x_{2}\mapstor\lambdax_{2},\ quad\lambda>0$$
(7)

\(\mathbb{R}^{+}=(0,+\infty)\)被解释为所有可能的可见光强度的集合,两者都是嵌入真实一维向量空间中的圆锥体\(\mathbb{R}\)关于正实数的普通乘法的群。非常简单的观察结果是

$$\对于所有x,y\in\mathbb{R}^{+},\quad y=\frac{y}{x} x个\等于\lambda x$$
(8)

说明了这一点\(\mathbb{R}^{+}\) 是一个 \(\mathbb{R}^{+}\)-均质圆锥.Weber–Fechner定律意味着两个感知光之间的相对亮度是\(\mathbb{R}^{+}\)-不变函数定义于\(\mathbb{R}^{+}\)这里至关重要的是,在选择测量单位之前,韦伯-费奇纳定律表示的亮度差异与独特的 \(\mathbb{R}^{+}\)-不变黎曼距离脚注\(\mathbb{R}^{+}\)

$$d(x_{1},x_{2})=\bigl\vert\log(x_}1})-\log(x_2})\bigr\vert=\biggl\vert\log\frac{x_1}}{x_2}}\biggr\vert,\quadr x_1},x_2}\mathbb{R}^{+}$$
(9)

这一考虑对Resnikoff来说是一个很大的启发,他将这些想法扩展到了三维颜色空间\(\mathcal{P}\).

3.2 \(\mathcal{P}\)作为同质空间

Resnikoff的均匀感知颜色空间模型与他假设的非标准观测配置密切相关,如图所示1.

图1
图1

Resnikoff假设的观测配置。在Resnikoff的模型中,颜色总是与物理光和嵌入它的均匀背景照明给出的一对颜色相关联

在此设置中,颜色始终与嵌入在统一上下文中的光刺激相关联。因此,在这种情况下\(\mathcal{P}\)在中给出(2)必须修改如下:

$$\mathcal{P}=\bigl(L^{2}_{+}(\varLambda)\乘以L^{2}_{+}(\varLambda)\bigr)/{\sim}$$
(10)

即感知的颜色\(x\in\mathcal{P}\)这里定义为一类感知对等的情侣\L中的((\textbf{x},\textbf{b})^{2}_{+}(\varLambda)\乘以L^{2}_{+}(\varLambda)\),其中x个是中央光刺激和b条是均匀分布在背景上的灯光。两对截然不同的夫妇\((\textbf{x}_{1} ,\textbf{b}_{1})\)\((\textbf{x}_{2} ,\textbf{b}_{2})\)\(\textbf{x}_{1} \neq\textbf{x}_{2}\)\(\textbf{b}_{1} \neq\textbf{b}_{2}\),属于相同的等价类,如果,对于\(i=1,2),中心光刺激\(\textbf{x}_{i} \)嵌入相应的背景中\(\textbf{b}_{i} \)诱导相同的感知颜色\(x\in\mathcal{P}\).Resnikoff不评论在这种非标准观测配置中,\(\mathcal{P}\)守恒正则凸锥的性质;这是一个极为重要的问题,将在Section中讨论。 3.3。目前,我们假设\(\mathcal{P}\)也是一个规则的凸锥。

如第。 2,我们定义了包含\(\数学{P}\)作为\(V=\mathcal{P}(P)-\数学{P}\)唯一的区别是,在Resnikoff的设置中,将对嵌入统一背景中的颜色刺激进行颜色匹配,而不是对独立的物理灯光进行颜色匹配。这需要一种Resnikoff没有讨论过的新的颜色匹配规范。

一旦建立了模型框架,我们就可以开始进行导致同质性公理的数学构造。首先,因为\(\mathcal{P}\)是嵌入三维实向量空间中的(正)锥V(V)\(\operatorname{Aut}(\mathcal{P})\)将由定向保护线性变换 V(V) 哪个保存 \(\mathcal{P}\)

$$\operatorname{GL}^{+}(\mathcal{P}):=\bigl\{B\in\operator name{GL}(3,\mathbb{R}),\det(B)>0\text{和}B(x)\in\mathcal{P}\forall x\in\mathcal{P}\bigr\}$$
(11)

哪里\(\operatorname{GL}(3,\mathbb{R})\)被识别为可逆实群\(3次3次)行列式不同于零的矩阵,即\(\mathrm{M}(3,\mathbb{R})\cong\mathbb{R}^{9}\)属于\(\operatorname{det}^{-1}\{0\}\),由行列式函数求0的逆像,在欧氏拓扑中是连续的,因此\(\operatorname{det}^{-1}\{0\}\)已关闭,因此\(\operatorname{GL}(3,\mathbb{R})\)是的开放子集\(\mathbb{R}^{9}\)引入了正行列式的要求,以尊重圆锥各母线的方向\(\mathcal{P}\).

Resnikoff声称如果我们解释\(操作名{GL}^{+}(\mathcal{P})\)作为'背景照明的变化',或背景变换简而言之,然后是\(\operatorname{GL}^{+}(\mathcal{P})\)\(\数学{P}\)是可传递的,因此\(\mathcal{P}\)均质圆锥体。他所用的论点遵循这一推理思路。首先,人们普遍认为,任何感知到的颜色\(x\in\mathcal{P}\)可以转换为任何“足够接近”的\(y\in\mathcal{P}\)通过适当改变背景照明,见图2用于此现象的图形表示。

图2
图2

背景变化的影响示例。出现在两幅图像中心的内部磁盘是完全相同的物理颜色刺激。然而,相对于背景照明,左侧图像中的颜色被视为非常饱和的绿色,而右侧图像显示的背景照明发生变化后,颜色刺激被视为黄色。由于本文档中的颜色刺激较小,因此它们被一个薄的黑色圆圈包围,以增强可见性

因此,\(\mathcal{P}\)可以看作是关于群的局部齐次空间\(\operatorname{GL}^{+}(\mathcal{P})\)。请注意,这是不是物理属性颜色,但感知特征通常被称为彩色感应,参见示例[91019]有关如何测量感应的更多详细信息。

我们现在需要一些拓扑方面的考虑。\(\数学{P}\)继承度量空间的结构V(V),被认为是三维欧几里德空间。局部同质性意味着\(x\in\mathcal{P}\),有一个开放的社区\(U_{x}\子集\数学{P}\)这样,每个\(y \在U_{x}\中)可以表示为\(y=B(x)\ in \ mathcal{P}\)对一些人来说\(操作名{GL}^{+}(\mathcal{P})\),所以的每个元素\(\mathcal{P}\)是一个内部点。要继续:\(\mathcal{P}\) 在中打开 V(V).

现在让我们结合公理3考虑局部同质性,即\(\mathcal{P}\):每两种感知颜色\(x,y\ in \ mathcal{P}\),线段加入的x个完全位于\(\mathcal{P}\).局部同质性确保\(z以L计),有一个开放的社区\(U_{z}\子集\数学{P}\)这是关于群的齐次空间\(\operatorname{GL}^{+}(\mathcal{P})\).作为z(z)在以下方面有所不同,我们得到了开放覆盖\(L}U{z}中的\bigcup_{z\)属于,以及,自是的紧子集\(\mathcal{P}\),我们可以提取有限的,有限的的开放式覆盖即存在\(L\中的x_{1},\ldots,x_{n})\(n<+\ infty \),因此\(\bigcup_{k=1}^{n}U_{x_{k}}\)是一个开放的覆盖.

\(B_{k}\in\operatorname{GL}^{+}(\mathcal{P})\)是携带的背景照明的变化\(x{k}\)\(x{k+1}\),其中\(k=1,\ldots,n-1)\(x_{0}\等于x\)、和\(x{n}\equivy)那么,因为\(\operatorname{GL}^{+}(\mathcal{P})\)是一个群体,转变\(B\equiv B_{n}\circ B_{n-1}\cick\cdots\circ B_{1}\)携带x个\(y=B(x)\)每两种感知到的颜色\(x,y\ in \ mathcal{P}\)因此,\(\mathcal{P}\)是一个\(\operatorname{GL}^{+}(\mathcal{P})\)-均匀空间。

有人可能会反对,从操作上讲,改变任何颜色感觉\(x\in\mathcal{P}\)任何其他人\(y\in\mathcal{P}\)通过背景光的单一改变,如果x个在色彩属性方面相距甚远。以下注意事项将阐明如何正确解释背景变换的构成。让我们再考虑一下图2并搜索转换B类这样的绿色感觉\(x\in\mathcal{P}\)\(x=[(\textbf{x}_{0},\textbf{b}_{0})]_{\sim}\)左侧图像中心的颜色刺激被转换为任意不同的颜色\(y\in\mathcal{P}\).第一次转型\(B_{1}\)例如,我们可以使用图右侧所示的2关键观察结果是,由于本节开头所述,黄色的感知颜色\(x_{1}\在\数学{P}\中)\(x{1}=[(\textbf{x}_{0},\textbf{b}_{1} )]_{\sim}\)\(\textbf{b}_{1} \neq\textbf{b}_{0}\),可以用另一对来表征\((\textbf{x}_{1} ,\波浪线{\textbf{b}}_{1})\)匹配的\(x{1}\)然后,通过明智地选择背景变化\(B_{2}\)关于\(x{1}\),我们可以把它变成一种颜色\(x_{2}\在\mathcal{P}\中)\(x{2}=[(\textbf{x}_{1} ,\textbf{b}_{2} )]_{\sim}\),感觉更接近\(x{1}\)。如前所述,\(x{2}\)可以用另一对来描述\((\textbf{x}_{2} ,\波浪号{\textbf{b}}_{2})\)以及第三次背景转换\(B_{3}\)可以在最后一个配置上操作,获得颜色\(x_{3}\在\mathcal{P}\中)感觉上更接近\(x{2}\)。通过重复前面的步骤,我们可以找到与所需颜色相匹配的颜色当然,实验过程必须费力地进行,可能非常耗时,但上面讨论的数学论证保证了该过程可以在有限的步骤内完成。

在图中我们报告感知到的颜色\(x{1},\点,x{5}\)通过上述过程获得的,其示出了如何通过背景变换的合成来逐渐向另一种颜色感觉移动颜色感觉。

图3
图3

背景变换的合成。从左到右:用文本中解释的过程构成四个背景变换的效果

到目前为止讨论的所有考虑都证明了为什么Resnikoff被引导假设他自己关于颜色空间结构的第五条公理。

  • 公理5(Resnikoff 1974年[1])\(\mathcal{P}\)是一个\(\operatorname{GL}^{+}(\mathcal{P})\)-均匀空间。

公理1到5意味着\(\mathcal{P}\) 是开凸正则齐次锥(同样有联系的可收缩的)嵌入三维向量空间V(V).

这些物体已经分类,这将使我们能够明确确定\(\mathcal{P}\)然而,我们将此分析推迟到Sect。 4在一段插曲之后,我们讨论了一个与背景变换的线性相关的重要问题。

3.3Resnikoff模型中的线性问题

背景光变化的传递作用\(\mathcal{P}\)已经在上面进行了广泛的分析。在这里,我们专注于他们必须实现的剩余属性。

当然每个B类保存\(\mathcal{P}\)因为在背景改变之后感知到的颜色仍然是这样的;此外,所有转换B类显然是可逆的,因为我们可以执行相反的改变,并返回到原来的颜色感觉。

然而,Resnikoff未能分析的一个关键问题是:不清楚为什么背景变化应该是线性的事实上,报纸上是Resnikoff本人[2]稍晚出版[1],声明此问题为“验证最少的方面他所考虑的一组转换。

数学上,线性背景变换\(操作员姓名{GL}(V))\(\mathcal{P}\):

$$B(\alpha x+\beta y)=\alpha-B(x)+\beta-B(y),\quad\alpha,\beta\in\mathbb{R}^{+},x,y\in\mathcal{P}$$
(12)

在图中4我们概述了一个心理物理实验,以检查背景变换的可加性。可以使用类似的程序验证B类与缩放成线性关系。

图4
图4

检查背景变换可加性的心理物理实验。图片中概述的实验设置可用于检查背景变换的可加性,有关详细说明,请参阅文本

考虑两个物理灯光x个以及它们的叠加\(\textbf{x}+\textbf{y}\),所有三个都嵌入到背景中b条.它们会引起色觉x个和,假设公式(4),\(x+y \).背景改变后B类b条\(\textbf{b}'\),由x个\(\textbf{x}+\textbf{y}\)将成为\(B(x)=[(\textbf{x},\textbf{B}')]_{\sim}\)\(B(y)=[(\textbf{y},\textbf{B}')]_{\sim}\)\(B(x+y)=[(\textbf{x}+\textbf{y},\textbf-{B}')]_{\sim}\)分别为。

然后考虑一个辅助背景\(\textbf{b}“”)并搜索物理灯光\(\波浪线{\textbf{x}}\)\(\波浪线{\textbf{y}}\)嵌入\(\textbf{b}''),被视为\(B(x)\)\(B(y)\)\(B(x)=[(波浪线{\textbf{x}},\textbf{B}'')]_{\sim}\)\(B(y)=[(\tile{\textbf{y}},\textbf{B}'')]_{\sim}\)分别是。因此\(\波浪线{\textbf{x}}\)\(\波浪线{\textbf{y}}\)将给予\(B(x)+B(y)=[(波浪线{\textbf{x}}+\tilde{\textbf{y}},\textbf{B}'')]_{\sim}\).如果\(B(x+y)=[(\textbf{x}+\textbf{y},\textbf-{B}')]_{\sim}\)比赛\(B(x)+B(y)=[(波浪线{\textbf{x}}+\tilde{\textbf{y}},\textbf{B}'')]_{\sim}\),然后B类相对于辅助背景而言是相加的\(\textbf{b}“”)通过使用一组充分多样化的辅助背景重复测试B类关于x个b条\(\textbf{b}'\)已测试。最后,通过改变x个b条\(\textbf{b}'\),的可加性B类 兜售法院已测试。

在关于背景变化的线性假设得到实验证实之前,它仍然是Resnikoff模型的核心猜测。

如果这些变换被证明是非线性的,这不会使我们将在下一节讨论的Resnikoff的结果无效,这只意味着组\(\operatorname{GL}^{+}(\mathcal{P})\),应该对其起传递作用\(\mathcal{P}\),不能由背景照明的更改表示。另一方面\(\数学{P}\)看起来很合理,没有什么可以阻止其他(目前未知的)转换被传递作用于组的元素识别\(\mathcal{P}\).

4同质性公理对几何结构的影响\(\mathcal{P}\)

在本节中,我们利用齐次空间理论的标准结果来证明[1]. 例如,经典参考文献[2021]、和[12]。

一个元素\(操作名{GL}^{+}(V))属于\(\operatorname{GL}^{+}(\mathcal{P})\)当且仅当\(g(\overline{\mathcal{P}})=(的拓扑闭包\(\mathcal{P}\)),因此\(\运算符名称{GL}^{+}(\数学{P})\)是的封闭子组\(\操作员姓名{GL}^{+}(V)\)因此它本身就是一个李群。此外,对于每个固定的\(x\in\mathcal{P}\),的子组\(\operatorname{GL}^{+}(\mathcal{P})\)由定义\(K_{x}=\{B\in\operatorname{GL}^{+}(\mathcal{P}),B(x)=x\}\)称为稳定器或各向同性子群\(\operatorname{GL}^{+}(\mathcal{P})\)x个.在颜色感知方面,对于固定感知颜色\(x\in\mathcal{P}\)由给定背景中的光刺激产生,\(K_{x}\)表示留下颜色感觉的背景变化的子组x个保持不变。

\(\mathcal{P}\)是均质凸锥\(K_{x}\)s与的极大紧子群重合\(\operatorname{GL}^{+}(\mathcal{P})\)所有的各向同性子群都是同构的,因为它们是共轭的,即。\(对于所有x,y\ in \mathcal{P}\) \(\exists\tilde{B}\in\operatorname{GL}^{+}(\mathcal{P})\)这样的话\(K_{y}=\波浪线{B} K(K)_{x} {\波浪线{B}}^{-1}\)由于这个原因,它们可以被识别,我们可以简单地写K而不是\(K_{x}\).

以下结果至关重要:如果差动歧管X(X)是一个G公司-齐次空间w.r.t作用\(eta:G\乘以X\到X\)李群的G公司K稳定器是固定的吗\(x中的x),然后是地图脚注4\(β:G/K\到X\)由定义\(β(gK)=β(g,x)\)是一个微分同构。

我们掌握了所需的所有信息,以便为[1]。

定理1

公理15暗示 \(\mathcal{P}\) 与两者都不同

$$\马塔尔{P}(P)_{1} \cong\mathbb{R}^{+}\times\mathbb{R}^{+{\times\ mathbb}R}^}+}$$
(13)

$$\马塔尔{P}(P)_{2} \cong\mathbb{R}^{+}\times\operatorname{SL}(2,\mathbb{R})/\operatorname{SO}(2)$$
(14)

第一个特征体现了具有三个分离的色坐标的众所周知的颜色空间,例如LMS、RGB、XYZ等,参见[22]. Resnikoff获得的第二个特征相对于经典平面颜色空间来说是新颖的。引入了常负曲率的二维Poincaré–Lobachevsky空间\(\operatorname{SL}(2,\mathbb{R})/\operator name{SO}(二)\)在色彩理论中。

定理的证明1

将上述结果应用于均匀颜色空间\(\mathcal{P}\),我们得到了微分识别

$$\mathcal{P}\cong\operatorname{GL}^{+}(\mathcal{P})/K$$
(15)

让我们重写每一个\(操作名{GL}^{+}(\mathcal{P})\)在表单中\(B=\det(B)\frac{B}{\dete(B)}\),其中\(\det(B)\in\mathbb{R}^{+}\)\(\frac{B}{\det(B)}\in\operatorname{SL}(\mathcal{P})\),其中\(\operatorname{SL}(\mathcal{P})\)是的子组\(\operatorname{GL}^{+}(\mathcal{P})\)由该群的矩阵和行列式1给出。

由此可见\(\operatorname{GL}^{+}(\mathcal{P})=\mathbb{R}^{+/}\times\operator name{SL}(\ mathcal})\)和,因为的各向同性子群\(\mathbb{R}^{+}\)显然是\(\{1\}\)\(\mathbb{R}^{+}/\{1 \}\cong\mathbb{R}^{+}\),商运算的唯一重要部分是在闭子群上K属于\(\operatorname{SL}(\mathcal{P})\),因此

$$\mathcal{P}\cong\mathbb{R}^{+}\times\operatorname{SL}(\mathcal{P})/K$$
(16)

其中两者都是\(\mathbb{R}^{+}\)\(\运算符名称{SL}(\数学{P})/K\)是同质空间。

作为差动歧管,\(\mathcal{P}\)尺寸为3且\(\mathbb{R}^{+}\)尺寸为1,所以\(\operatorname{SL}(\mathcal{P})/K\)具有维度2。此外,\(\mathcal{P}\)\(\mathbb{R}^{+}\)是相连和可收缩的,因此表达(16)也意味着\(\operatorname{SL}(\mathcal{P})/K\)是相连的,可收缩的。Sophus Lie对此类空间进行了分类[23],另请参见[24]和[25]以获得更现代的论文。结果表明,唯一的二维连通可压缩齐次空间是\(\mathbb{R}^{2}\),不同于\(\mathbb{R}^{+}\times\mathbb{R}^{+{)通过地图\(\mathbb{R}^{2}\ni(x,y)\mapsto(\exp(x),\exp,或双曲线平面\(\operatorname{SL}(2,\mathbb{R})/\operator name{SO}(二)\)(参见第4.1有关双曲空间的更多详细信息)。

Resnikoff在[1]它不仅要长得多,很难遵循,而且也有缺陷。事实上,他的证明的一个基本论点是第112页上的陈述,无论\(\mathcal{P}\),收缩性\(\mathcal{P}\)意味着李群\(\operatorname{SL}(\mathcal{P})\)与其李代数的指数重合\(\mathfrak{sl}(\mathcal{P})\)然而,正如我们在附录举个反例。

4.1双曲空间的模型\(\operatorname{SL}(2,\mathbb{R})/\operator name{SO}(二)\)

具有感知的颜色空间\(\mathcal{P}(P)_{2}\)Resnikoff在色度学中引入了双曲线空间。在1974年的论文中,他承认了H.Yilmaz 1962年的工作[26]这是历史上第一个考虑双曲线结构来研究颜色感知的机构,尽管其严谨程度远不及Resnikoff。

与欧几里德空间或球面不同,双曲空间可以用几种等价的方式来表征,称为模型,每个都有不同的用途。有关双曲线模型的一般讨论,请参见例如[27]. 在这里,我们只报告我们感兴趣的双曲线空间的模型,即。\(\operatorname{SL}(2,\mathbb{R})/\operator name{SO}(二)\):

  • 双曲面\(I^{2}=\{v\in\mathbb{R}^{3}:\langlev,v\rangle_{mathcal{L}}=-1,v_{3}>0\}\),其中\(语言v,v范围{数学{L}}=v{1}^{2}+v{2}^{2} -v型_{3}^{2}\)是洛伦兹标量积\(\mathbb{R}^{3}\).方程式\(语言v,v范围{数学{L}}=-1\)在中定义两张双曲面\(\mathbb{R}^{3}\)以便\(I ^{2}\)是连接的组件\(v{3}>0\)也称为上双曲面片;

  • 上半平面\(H=\{(x,y)\in\mathbb{R}^{2}:y>0\}\cong\{z\in\mathbb{C}:\mathfrak{Im}(z)>0\{);

  • 庞加莱圆盘\(\mathcal{D}=\{(x,y)\in\mathbb{R}^{2}:x^{2}+y^{2}<1\}\cong\{z\in\mathbb{C}:|z |<1\}\);

  • \(\操作员姓名{符号}_{1} ^{+}(2,\mathbb{R}),一套\(2次2次)实对称正定矩阵M(M)使用酉行列式,即。\(M^{t}=M\)\(\operatorname{det}(M)=1\)\(u)^{t} 亩>0\)为所有人\(u\in\mathbb{R}^{2}\).

这最后一个特征对于以下方面尤其重要。事实上,它将给我们提供解释\(\mathcal{P}(P)_{2}\)作为矩阵。为了了解如何,让我们定义\(\operatorname{Sym}^{+}(2,\mathbb{R})\)成为一套\(2次2次)实对称正定矩阵,任意矩阵\(操作名{Sym}^{+}(2,\mathbb{R})\)可以写为\(M=\det(M)\frac{M}{\dete(M)}\)具有\(\det(M)\in\mathbb{R}^{+}\)自从M(M)是正定的,并且\(N=\frac{M}{\det(M)}\in\operatorname{符号}_{1} ^{+}(2,\mathbb{R})这个简单的考虑意味着

$$\马塔尔{P}(P)_{2} \cong\text{Sym}^{+}(2,\mathbb{R})$$
(17)

5颜色空间中不变黎曼度量的选择\(\mathcal{P}(P)_{1}\)\(\mathcal{P}(P)_{2}\)

一旦Resnikoff建立了唯一可能的几何结构\(\数学{P}\)与公理1–5兼容,他在\(\mathcal{P}\)测量颜色差异。至于几何结构\(\mathcal{P}\),由于不变性原则,他独特地挑出了度量标准。

我们记得黎曼度量关于可微流形X(X)尺寸的n个是类型为的对称正定张量场\((0,2)\)X(X)即针对每个点进行平滑分配的通信\(x中的x),标量积\(g_{x}:T_{x} x(x)\次T_{x} x(x)\到\mathbb{R}\)\((v,w)映射到g{x}(v,w)为所有人\(v,w\在T_{x}x\中),切线空间X(X)在里面x个.可微流形X(X)具有黎曼度量称为黎曼流形\((X,g)\).

让我们还回顾一下:我们修复了本地图表\((U,\varphi)\)属于x个,我们用\((x^{1},\ldot,x^{n})\)的局部坐标x个\((部分{1},部分{n})切空间的相应局部基\(T_{x} x(x)\).平滑功能\(g_{\mu\nu}\in\mathcal{C}^{\infty}(U)\)\(\mu,\nu=1,\ldots,n\),由定义\(g{\mu\nu}=g(部分{\mu},部分{\nu})验证\(g=g{\mu\nu}\,dx^{\mu}\ otimesdx^}\)其中隐含使用了爱因斯坦对上下重复指数的求和。的组件\(g{\mu\nu}\)可以组织在对称矩阵中,前面的表达式通常写成\(ds^{2}=g{\mu\nu}\,dx^{\mu}\,dx^{\nu}\).

黎曼流形\((X,g)\)也是一个度量空间,关于由并借助分段正则曲线的长度定义\(\gamma:[0,1]\到X\).如果\((X,g)\)是连通黎曼流形,那么,如果我们定义曲线的长度γ作为

$$L(\gamma)=\int_{0}^{1}\bigl\Vert\dot{\gamma}(u)\bigr\Vert_{\gama(u)}\,du$$
(18)

哪里\(\|\dot{\gamma}(u)\|_{\garma(u规范是由,然后是函数\(d:X\乘以X\到\mathbb{R}^{+}\)由定义

$$d(x,y)=\inf\bigl\{L(\gamma),\gamma:[0,1]\to x\text{分段正则},\gama(0)=x,\garma(1)=y\bigr\}$$
(19)

距离是X(X),称为黎曼距离X(X)由黎曼度量导出.

分段正则曲线γ在里面X(X)使一对点之间的黎曼距离最小化\(x中的x,y\)据说是一个测地线的连接这两点。因此,黎曼距离\(d(x,y)\)可以定义为测地线连接的长度x个.

现在让我们考虑一下X(X)作为感知颜色空间\(\mathcal{P}\)由于公理1–5决定了\(\数学{P}\)作为一个同质空间,Resnikoff自然会搜索关于\(\mathcal{P}\)与这些公理相一致。

如果\(x,y\ in \ mathcal{P}\)感知到的颜色与\((\textbf{x},\textbf{b})\)\((\textbf{y},\textbf{b})\)分别在背景照明改变后B类b条\(\textbf{b}'\neq\textbf{b}\)x个将修改为\(x'=B(x)\in\mathcal{P}\)\(y’=B(y)\ in \ mathcal{P}\).

Resnikoff想分析以下假设(他称之为公理6)的后果:如果\(d:\mathcal{P}\times\mathcal{P}\到[0,+\infty)\)是黎曼距离\(\mathcal{P}\)测量感知颜色对之间的感知差异\(x,y\ in \ mathcal{P}\),然后d日满足

$$d\bigl(B(x),B(y)\bigr)=d(x,y),\quad\对于所有x,y\in\mathcal{P},\forall B\in\operatorname{GL}^{+}(\mathcal{P})$$
(20)

即两者之间的感知差异x个与以下两者相同\(x’\)\(y’\)或者,用数学术语来说,B类是距离的等距d日然而,必须驳斥这一假设,因为它与人类的颜色感知不一致,正如脆化效应如图所示5同一对颜色刺激嵌入三个不同的背景中,很明显知觉差异不是背景独立的.

图5
图5

清脆的效果。用于驳斥Resnikoff关于感知颜色度量相对于背景照明变化的不变性的公理6的锐化效果(见正文)

然而,遵循Resnikoff的论点并确定\(\mathcal{P}\)满足等式(20),因为这将指出,这些指标不适合表示上下文中颜色的感知距离。

的请求\(\operatorname{GL}^{+}(\mathcal{P})\)-不变性允许以独特的方式识别\(\mathcal{P}(P)_{1}\)\(\mathcal{P}(P)_{2}\)首先,让我们回顾一下所有微分同胚\(f:X\到Y\)诱导线性同构\(df_{x}:T_{x} x(x)\到T_{f(x)}Y\),加上,如果\((X,g)\)\((Y,h)\)是黎曼流形\(d_{h}\)\(d_{g}\)是与黎曼度量相关的黎曼距离吗小时,然后(f)是等距,即。\(d_{h}(f(x),f(y))=d_{g}(x,y)\)为所有人\(x中的x,y\)当且仅当

$$h_{f(x)}\bigl(df_{x}(v),df_{x}(w)\bigr)=g_{x{(v,w),对于x中的所有x,对于所有v,对于T中的w_{x} 十、。 $$
(21)

在我们的案例中,通过选择\(X=Y=\数学{P}\)\(f=B),我们有可能重新定义等距条件,如(20)如下:

$$g_{B(x)}\bigl(dB_{x}(v),dB__{x{(w)\bigr)=g_{xneneneep(v,w),\quad\对于所有B\in\operatorname{GL}^{+}(\mathcal{P}),\对于所有x\in\mathcal{P}.对于所有v,w\in\T_{x}$$
(22)

现在回想一下\(\mathcal{P}\cong\运算符名称{GL}^{+}(\mathcal{P})/K\)通过同质性\(\mathcal{P}\),对于每两个元素\(x,y\ in \ mathcal{P}\),我们可以写\(y=B(x)\)对一些人来说\(B\in\运算符名称{GL}^{+}(\mathcal{P})\)。如果我们选择x个恒等式变换的等价类\(\operatorname{GL}^{+}(\mathcal{P})\)属于,即陪集K然后,根据定义,我们得到\(B(x)=x)为所有人\(B\在K\中).通过及物性K-不变性与选择无关x个,因此方程式(22)意味着

$$g{x}\bigl(dB{x}(v),dB{x}(w)\bigr)=g{x{(v,w),对于K中的所有B\,对于mathcal{P}中的所有x\,对于所有v,对于T中的w\(mathcal{P})$$
(23)

对感知颜色度量的探索\(\mathcal{P}\)从而简化为更简单的搜索任务K-空间的不变黎曼度量\(\mathcal{P}(P)_{1}\)\(\mathcal{P}(P)_{2}\).

对于\(\mathcal{P}(P)_{1}\)\(K=\空集\),所以K-不变性不会引入任何约束。但是,度量必须是\(\mathbb{R}^{+}\)-每个因素和所有因素的不变度量\(\mathbb{R}^{+}\)-上的不变度量\(\mathbb{R}^{+}\)成比例:一旦我们确定了一个这样的指标,所有其他指标都是它的正倍数。

很明显\(\mathbb{R}^{+}\)-上的不变度量\(\mathbb{R}^{+}\)由给定\(ds^{2}=(\压裂{dx}{x})^{2{),因此满足等式(20)上的\(\mathcal{P}(P)_{1}\)

$$ds^{2}=\alpha_{1}\biggl(\frac{dx{1}}{x{1{}\bigr)^{2{+\alpha_2}\bigl{k}\in\mathbb{R}^{+},k=1,2,3$$
(24)

这正是斯泰尔斯对亥姆霍兹度量的推广(最后一个对应于特定的情况\(\alpha_{1}=\alpha_2}=\alpha_3}=1\)),参见示例[7]。

对于\(\mathcal{P}(P)_{2}\)\(K=\操作员姓名{SO}(2)\),使得\(\mathcal{P}(P)_{2}\)在任何时候\(x\in\mathcal{P}(P)_{2}\)

$$T_{x}\数学{P}(P)_{2} =\mathbb{R}\oplus T_{K}\operatorname{SL}(2,\mathbb{R})/\operator name{SO}(1),\quad\对于所有x\in\mathcal{P}(P)_{2}. $$
(25)

在这种情况下,K-不变性意味着旋转下的不变性,因此,用于此实现的背景-非变化颜色度量\(\mathcal{P}\)必须是一维和二维欧氏度量的总和。这意味着,对于\(\mathcal{P}(P)_{2}\),颜色度量满足(20)对于每个笛卡尔因子的度量单位的选择来说是唯一的\(\mathbb{R}^{+}\)\(\operatorname{SL}(2,\mathbb{R})/\operator name{SO}(二)\).

上此类度量的显式特征\(\mathcal{P}(P)_{2}\)可以通过回忆公式(17)第节。 4.1那个\(\mathcal{P}(P)_{2} \cong\text{Sym}^{+}(2,\mathbb{R})\)从而解释感知到的颜色x个作为一个\(2次2次)正定实对称矩阵。

的操作\(\operatorname{GL}(2,\mathbb{R})\)\(\mathcal{P}\)由给定\(\运算符名称{GL}(2,\mathbb{R})\times\mathcal{P}(P)_{2} \到\马塔尔{P}(P)_{2}\)\((A,x)\映射到AxA^{t}\)因此,每个背景转换\(B:\马塔尔{P}(P)_{2} \到\数学{P}(P)_{2}\)可以通过矩阵参数化\(操作名{GL}(2,\mathbb{R}))内容如下:\(B_{A}(x)=轴A^{t}\)事实证明\(\operatorname{GL}(2,\mathbb{R})\)-上的不变黎曼度量\(\mathcal{P}(P)_{2}\)是所谓Rao–Siegel度量的标量倍数[2830]

$$ds^{2}=\operatorname{Tr}\bigl(x^{-1}dxx^{-1}dx\bigr)$$
(26)

Tr是矩阵轨迹。让我们验证一下\(\operatorname{GL}(2,\mathbb{R})\)-不变性:首先要注意\(B_{A}(x)^{-1}={(A^{t})}通过线性关系,\(dB_{A}(x)=A\,dxA^{t}\).所以

$$开始{对齐}\operatorname{Tr}\bigl(B_{A}(x)^{-1}\,dB_{A}(x)B_{A}}\bigr)}^{-1}x^{-1-A^{-1{A\,dxA^{t}\biger。\结束{对齐}$$
(27)

通过使用轨迹的循环特性,我们得到

$$\运算符名称{Tr}\bigl(B_{A}(x)^{-1}\,dB_{A}(x)B_{A}$$
(28)

\(对于所有B_{A}\in\operatorname{GL}(2,\mathbb{R})),从而确认\(\operatorname{GL}(2,\mathbb{R})\)-不变性。

要继续,亥姆霍兹-斯蒂尔斯公制 \(\数学{P}(P)_{1}\) 和Rao–Fisher度量 \(\mathcal{P}(P)_{2}\) 不能视为上下文中颜色的感知度量因为它们破坏了冰晶效应。上下文中的颜色是指在视觉场景中感知到的颜色刺激,其中背景可以经历时间和/或空间变化。当然,在背景固定的情况下,锐化效应并不能取消上述指标的资格。然而,在这种情况下,我们不能再使用关于背景变化下不变性的论点来将其单独列出。

1974年,Resnikoff发表论文时[1],关于这一知觉现象的论文寥寥无几。这就解释了为什么他在没有意识到这一点的情况下,错误地认为感知颜色指标应该是背景不一致的。

6结论

对感知颜色空间的Resnikoff模型及其同质性公理的详细分析\(\mathcal{P}\)我们得出了以下结果:首先,我们提供了一个替代的、更简单的证明,证明了[1]也就是说,只有两种几何结构与薛定谔公理和Resnikoff同质性公理相容。我们还通过一个反例表明,原来的证明因一个不正确的数学假设而有缺陷。

其次,我们强调了发展心理物理实验的迫切性,以检查背景变换的线性,Resnikoff认为背景变换与传递作用的对称组是一致的\(\mathcal{P}\).已经详细说明了这样一个实验的建议。

最后,我们讨论了Resnikoff关于背景变换相对于黎曼度量的等距性质的假设\(\mathcal{P}\)这应该代表了他理论中的感性色彩差异。危机效应表明,必须驳斥雷斯尼科夫的假设;因此,赫尔姆霍兹-斯蒂尔斯(Helmholtz–Stiles)和费舍尔-拉奥(Fisher–Rao)指标,通过使用这个假设挑选出来的,在上下文中都不能是感知颜色距离。

在这篇由两部分组成的论文的后半部分中,\(\mathcal{P}\)将使用依赖于Jordan代数的不同策略进行分析。这两部分之间的联系是通过以下考虑得出的:薛定谔的公理意味着\(\mathcal{P}\)是嵌入三维实向量空间中的正凸锥。如果我们接受雷斯尼科夫的齐性公理,那么\(\mathcal{P}\)成为一个开放的正则齐次凸锥。通过添加最后一个假设,即所谓的自我二元性,\(\mathcal{P}\)成为对称圆锥结果表明,这些对象可以用(形式上真实的)Jordan代数的正元素来识别。与Jordan代数相关的丰富数学结果将允许建立一个新颖的类量子理论\(\mathcal{P}\).

笔记

  1. Resnikoff避免使用该术语元数等效,指的是当x个具有不同的光谱辐射功率分布,但它们产生相同的三刺激值[7]即匹配参考颜色所需的三种固定原色的权重。在Resnikoff之后,我们没有采用元数等效性,因为初级不干预他的模型。

  2. 这个假设是适用于非相干光因为,对于相干光,当两个光束叠加时,破坏性干涉可以在某些空间位置熄灭光强。

  3. 也就是说,与正标量相乘的唯一黎曼距离是等距的,参见第节。 5有关此的更多详细信息。

  4. 我们记得,给定一个拓扑群G公司,正规子群H(H)属于G公司是的子组G公司这样的话\(gH=汞) \(对于g中的所有g),其中\(gH=\{gH,h\在h\}\中)是的左陪集H(H)在里面G公司水电阻温度\(Hg=\{Hg,h\ in h\}\)是的右陪集H(H)在里面G公司水电阻温度.给定一个正规闭子群H(H)属于G公司商(或因子)组\(G/H\)是所有陪集(左或右,因为它们是相同的,因为H(H)正常),具有以下组结构:\((gH)(g'H)=(gg')H).

工具书类

  1. Resnikoff HL公司。微分几何和色彩感知。数学生物学杂志。1974;1:97–131.

    第条 数学科学网 谷歌学者 

  2. Resnikoff HL公司。关于色彩感知的几何学。In:生物学中的一些数学问题。不及物动词;1974年,第217-32页。(生命科学中的数学讲座;第7卷)。

    谷歌学者 

  3. Resnikoff HL公司。关于心理生理功能。数学生物学杂志。1975;2(3):265–76。

    第条 数学科学网 谷歌学者 

  4. Resnikoff HL公司。现实的幻觉。柏林:施普林格;2012

    数学 谷歌学者 

  5. Niall KK,编辑。埃尔文·薛定谔的色彩理论:用现代评论翻译;2017

    谷歌学者 

  6. 薛定谔E.收集了关于波动力学的论文。普罗维登斯:美国数学学会;2003

    谷歌学者 

  7. Wyszecky G,Stiles WS。颜色科学:概念和方法,定量数据和公式。纽约:Wiley;1982

    谷歌学者 

  8. Schanda J.比色法:了解CIE系统。纽约:Wiley;2007

     谷歌学者 

  9. Rudd ME,Zemach IK。消色差颜色感应的量化特性:边缘积分分析。Vis Res.2004;44:971–81.

    第条 谷歌学者 

  10. Gronchi G,Provenzi E.感知和认知中情境驱动效应的变分模型。数学心理学杂志。2017;77:124–41.

    第条 数学科学网 谷歌学者 

  11. Dubois E.颜色空间的结构和性质以及彩色图像的表示;2009年(关于图像、视频和多媒体处理的综合讲座;第4卷)。

    谷歌学者 

  12. Faraut J,Koranyi A.对称锥的分析。牛津:克拉伦登出版社;1994

    数学 谷歌学者 

  13. Schrödinger E.Grundlinien einer Theorye der Farbenmetrick im Tagessehen(日光视觉颜色测量理论概述)。英文版本:MacAdam DL,编辑。色彩科学的来源。剑桥:麻省理工学院出版社;1970年,第134-182页。Ann Phys。1920;63(4):397–456; 481–520.

  14. 牛顿·I·光学,或一篇关于光的反射、折射、折射和颜色的论文。北切姆斯福德:快递公司;1952

    谷歌学者 

  15. 格拉斯曼·H·祖尔(Grassmann H.Zur theorie der farbenmischung)。安·菲斯。1853;165(5):69–84.

    第条 谷歌学者 

  16. von Helmholtz H,Southall JPC。关于生理光学的论述。第3卷。北切姆斯福德:Courier Corporation;2005

    谷歌学者 

  17. Munkres J.拓扑。第2版,上鞍河:皮尔逊;2000

    数学 谷歌学者 

  18. Ashtekar A、Corichi A、Pierri M.色彩感知中的几何。黑洞、引力辐射和宇宙;1999年,第535-50页。

    第章 谷歌学者 

  19. Wallach H.亮度恒定性和非彩色的性质。实验心理学杂志。1948;38(3):310–24.

    第条 谷歌学者 

  20. 微分几何、李群和对称空间。纽约:学术出版社;1979年。(纯数学和应用数学;第80卷)。

    数学 谷歌学者 

  21. 华纳公司。可微流形和李群的基础。柏林:施普林格;2013年(数学研究生教材;第94卷)。

    数学 谷歌学者 

  22. Gonzales RC,Woods RE。数字图像处理。纽约:普伦蒂斯·霍尔出版社:2002年。

    谷歌学者 

  23. 李·S·转换理论鲁彭三世·莱比锡:特伯纳;1893

    数学 谷歌学者 

  24. Komrakov B,Churyumov A,Doubrov B.二维齐次空间。奥斯陆大学马特马提斯克学院(1993年)。

  25. Doubrov B,Komrakov B.低维伪黎曼齐次空间。奥斯陆大学马特马提斯克学院(1995年)。

  26. Yilmaz H.色彩视觉和一般感知的新方法。In:生物原型和合成系统;1962年,第126-41页。

    第章 谷歌学者 

  27. Martelli B.几何拓扑学导论。arXiv:1610.02592(2016).

  28. Amari S.统计学中的微分几何方法。柏林:施普林格;2012年。(统计学讲稿;第28卷)。

    数学 谷歌学者 

  29. Calvo M,Oller JM。基于嵌入Siegel群的多元正态分布之间的距离。多变量分析杂志。1990年;35(2):223–42.

    第条 数学科学网 谷歌学者 

  30. Siegel CL.辛几何。阿姆斯特丹:爱思唯尔;2014

    数学 谷歌学者 

下载参考资料

致谢

本文是受H.L.Resnikoff(1937-2018)杰出工作启发的色度学几何重建项目的一部分。这篇论文是为了纪念他。反例和对教派主要结果的新颖证明。 4在与Francesco Bottacin合作监督Padova大学Fiammeta Cirrone的硕士论文期间开发的,他们都得到了热烈的认可。

数据和材料的可用性

本手稿中包含的图像可根据作者的要求提供。

基金

本论文的部分资金来自法国中央研究院的80笔基本拨款。

作者信息

作者和附属机构

作者

贡献

作者写了整篇论文。作者阅读并批准了最后的手稿。

通讯作者

与的通信埃多亚多·普罗文齐.

道德声明

道德批准和参与同意

不适用。

相互竞争的利益

提交人声明,他没有相互竞争的利益。

出版同意书

不适用。

附录

附录

我们在本附录中讨论了一个反例,该反例表明,正如Resnikoff所声称的那样\(\mathcal{P}\)暗示\(\exp(\mathfrak{sl}(\mathcal{P}))=\operatorname{sl}(\ mathcal{P})\).

这个案子的论点已经讨论过了\(\operatorname{SL}(\mathcal{P})=\operator name{SL{(2,\mathbb{R})\)及其李代数\(\mathfrak{sl}(2,\mathbb{R})\)由真实的\(2次2次)无迹矩阵。如果指数映射\(\exp:\mathfrak{sl}(2,\mathbb{R})\to\operatorname{sl}然后是矩阵

$$T=\begin{pmatrix}-1&1\\0&-1\end{pmatricx}\in\operatorname{SL}(2,\mathbb{R})$$

可以写成\(T=导出(A))对于合适的\(A\in\mathfrak{sl}(2,\mathbb{R})\).由于著名的Schur分解定理,一个类似于上三角矩阵单位其对角元素是一个\(A=小狗^{-1}\),其中\(操作名{GL}(2,\mathbb{C})然而,由于其循环特性,跟踪是相似不变的,因此\(\operatorname{Tr}(A)=\operator name{Tr{(U)\)而且,作为\(\operatorname{Tr}(A)=0\),因此单位必须具有以下形式:

$$U=\开始{pmatrix}\α$$

\(\alpha,\beta\in\mathbb{C}),所以

$$A=P\begin{pmatrix}\alpha&\beta\\0&-\alpha\end{pmattrix}P^{-1}$$

α和−α是的特征值一个.回顾\(\exp(A)=\sum_{n\in\mathbb{n}}\frac{A^{n}}{n!}\),我们有

$$T=\exp(A)=\sum_{n\in\mathbb{n}}\frac{(PUP^{-1})^{n}}{n!}=P\biggl(\sum_{n\in \mathbb{n}{U^{n{}}{n!}\biggr)P^{-1}=P\ exp\begin{pmatrix}\alpha&beta\\0&-\alpha\end{pmatricx}P^{-1-}$$

我们现在可以展示这一矛盾。首先,如果\(\alpha\neq0\),则Schur分解定理保证α和−α\(2次2次)矩阵一个一个类似于对角矩阵:存在\(Q\in\operatorname{GL}(2,\mathbb{C})\)这样的话\(A=QDQ^{-1}\)具有\(D=\operatorname{diag}(\alpha,-\alpha)\).但是,\(T=导出(A)=Q\exp(D)Q^{-1})具有\(\exp(D)=\operatorname{diag}(e^{\alpha},e^{-\alpha{)\),这与事实相矛盾T型显然是不可对角化的。

相反,如果,\(阿尔法=0),然后

$$\exp\bearth{pmatrix}0&&贝塔\\0&0\end{pmatrix}=\bearth{pmatrix}1&0\\0&1\end{pmatrix}+\bearth{pmatrix}0&&贝塔\\0&0\end{pmatrix}+\sum_{n=2}^{infty}\frac{1}{n!}\bearth{pmatrix}0&0\end{pmatrix}=\bearth{pmatrix}1&&贝塔\\0&1\end{pmatrix}$$

这意味着\(\operatorname{Tr}(T)=-2\neq\operator name{Tr}(\exp(U)\vert_{alpha=0})=2\),但这不可能是真的,因为它与跟踪的相似不变性相矛盾。

权利和权限

开放式访问本文是根据Creative Commons Attribution 4.0国际许可证授权的,该许可证允许以任何媒体或格式使用、共享、改编、分发和复制,只要您对原始作者和来源给予适当的信任,提供指向Creative Commons许可证的链接,并指出是否进行了更改。本文中的图像或其他第三方材料包含在文章的Creative Commons许可证中,除非材料的信用额度中另有说明。如果文章的知识共享许可证中没有包含材料,并且您的预期用途不被法律法规允许或超出了允许的用途,则您需要直接获得版权所有者的许可。要查看此许可证的副本,请访问http://creativecommons.org/licenses/by/4.0/.

重印和许可

关于本文

检查更新。通过CrossMark验证货币和真实性

引用这篇文章

Provenzi,E.颜色感知的几何学。第1部分:均匀颜色空间的结构和度量。J.数学。神经科学。 10, 7 (2020). https://doi.org/10.1186/s13408-020-00084-x

下载引文

  • 收到:

  • 认可的:

  • 出版:

  • 内政部:https://doi.org/10.1186/s13408-020-00084-x

关键词