正如引言中所述[1]Resnikoff使用齐次空间理论研究感知颜色空间的几何和度量\(\mathcal{P}\)。这远不是一项微不足道的任务,因为构成\(\数学{P}\)从数学角度很难描述。因此\(\mathcal{P}\)它绕过了这些等价类的使用,这是非常可取的。
理解为什么Resnikoff在分析\(\mathcal{P}\)是一个关键点。因此,值得重温一下关于齐次空间的基本信息。
如果X(X)是一个非空集,并且G公司是一个组,然后是一张地图\(eta:G\乘以X\到X\),\((x,g)\映射到g(x)\)据说是的左动作G公司在X(X)如果\(e(x)=x),e(电子)是…的中性元素G公司,如果\((gh)(x)=克(h(x))为所有人\(g,h\单位:g\)和\(x中的x)在这种情况下,X(X)称为G公司-空间。如果我们解决了任何问题克,然后是地图\(\ta_{g}:X\到X\),\(x映射到g(x))是双向的,它的反义词是\(\eta_{g^{-1}}\),因为\(g(x)\mapstog^{-1}(g(x))=e(x)=x\)那么,左边G公司上的操作X(X)可以等价地定义为群同态\(G\到\运算符名称{Aut}(X)\),其中\(\操作符名{Aut}(X)\)是上所有自同构(一对一函数)的组X(X).任何元素\(g中的g)称为对称对于X(X).
自\(\mathcal{P}\)它不仅是一个集合,而且是嵌入向量空间中的凸锥,我们更感兴趣的是G公司-具有内在结构的空间。在这种情况下,我们打电话给X(X)一G公司-空格,如果元素G公司保留…的结构X(X)即,如果\(\运算符名称{Aut}(X)\)是类别的自同构组,其中X(X)例如,拓扑空间的同胚、光滑流形的微分同胚、向量空间的可逆线性映射等等。
固定任意\(x中的x),集合\(G\cdot x=\{G(x)\in x:G\in G\}\)被称为G公司-的轨道x个.X(X)据说是一个G-齐次空间如果\(G\cdot x=x\)对于每个\(x中的x)即,如果G公司在X(X)是可传递的。在这种情况下,对于每对元素\(x中的x,y\),存在转换\(g中的g)这样的话\(g(x)=y)这解释了为什么同质性的概念被称为数学术语这个空间没有一点是特别的.如果\(Y\子集X\),然后定义组\(\operatorname{Aut}(Y)=\{\varphi\in\operator name{Aut}(X):\varphi(Y)=Y\}\)的自同构X(X)仅限于Y(Y)成为…的自同构Y(Y),然后Y(Y)是G-同质如果由群同态定义的动作\(G\到\运算符名称{Aut}(Y)\)在上是可传递的Y(Y).
让我们将其应用于我们感兴趣的情况,即一般锥的情况\(\数学{C}\)嵌入实向量空间V(V)有限尺寸n个在这种情况下,如果我们定义\(\operatorname{GL}(\mathcal{C})=\{T\in\operator name{GL{(V),T(\mathcal{C{)=\ mathcal}\}\),然后\(\数学{C}\)据说是一个均质锥体 V(V)如果,对于任意两点\(a,b\ in \ mathcal{C}\),存在\(T\in\operatorname{GL}(\mathcal{C})\)这样的话\(b=T(a)\)。我们还需要此属性的本地化版本:\(\mathcal{C}\)是一个局部均匀锥 V(V)如果,对于每个\(C\中的a\),有一个开放的社区\(U_{a}\)属于一这样,对于每一个\(b\在U_{a}\中),存在\(T\in\operatorname{GL}(\mathcal{C})\)这样的话\(b=T(a)\),其中open指的是\(\mathcal{C}\)继承人V(V).
3.1学习的一维动机\(\mathcal{P}\)作为同质空间
Resnikoff宣称学习的动机\(\mathcal{P}\)齐次空间来源于对韦伯-费希纳定律的分析[7]以公制表示。韦伯-费希纳定律,通常被描述为有史以来确定的第一个心理物理定律,描述了人类对消色差刺激即仅取决于其强度的视觉输入(通常通过仅用昏暗的光激活视网膜杆来获得)。实验表明,非彩色强度刺激的知觉对应物\(x\in\mathbb{R}^{+}=(0,+\infty)\),已调用亮度并用表示\(b(x)\),与对数成正比x个(适用于各种强度)。因此,相对亮度\(b(x{1})-b(x{2})\)在两个强度的视觉刺激之间\(x_{1}\)和\(x{2}\)与…成比例\(\log(x{1})-\log对于所有正系数λ属于韦伯-费奇纳定律有效的值范围。这就解释了为什么相对亮度在同时修改由
$$x_{1}\mapsto\lambda x_{1},\qquad x_{2}\mapstor\lambdax_{2},\ quad\lambda>0$$
(7)
\(\mathbb{R}^{+}=(0,+\infty)\)被解释为所有可能的可见光强度的集合,两者都是嵌入真实一维向量空间中的圆锥体\(\mathbb{R}\)关于正实数的普通乘法的群。非常简单的观察结果是
$$\对于所有x,y\in\mathbb{R}^{+},\quad y=\frac{y}{x} x个\等于\lambda x$$
(8)
说明了这一点\(\mathbb{R}^{+}\) 是一个 \(\mathbb{R}^{+}\)-均质圆锥.Weber–Fechner定律意味着两个感知光之间的相对亮度是\(\mathbb{R}^{+}\)-不变函数定义于\(\mathbb{R}^{+}\)这里至关重要的是,在选择测量单位之前,韦伯-费奇纳定律表示的亮度差异与独特的 \(\mathbb{R}^{+}\)-不变黎曼距离脚注三在\(\mathbb{R}^{+}\)即
$$d(x_{1},x_{2})=\bigl\vert\log(x_}1})-\log(x_2})\bigr\vert=\biggl\vert\log\frac{x_1}}{x_2}}\biggr\vert,\quadr x_1},x_2}\mathbb{R}^{+}$$
(9)
这一考虑对Resnikoff来说是一个很大的启发,他将这些想法扩展到了三维颜色空间\(\mathcal{P}\).
3.2
\(\mathcal{P}\)作为同质空间
Resnikoff的均匀感知颜色空间模型与他假设的非标准观测配置密切相关,如图所示1.
在此设置中,颜色始终与嵌入在统一上下文中的光刺激相关联。因此,在这种情况下\(\mathcal{P}\)在中给出(2)必须修改如下:
$$\mathcal{P}=\bigl(L^{2}_{+}(\varLambda)\乘以L^{2}_{+}(\varLambda)\bigr)/{\sim}$$
(10)
即感知的颜色\(x\in\mathcal{P}\)这里定义为一类感知对等的情侣\L中的((\textbf{x},\textbf{b})^{2}_{+}(\varLambda)\乘以L^{2}_{+}(\varLambda)\),其中x个是中央光刺激和b条是均匀分布在背景上的灯光。两对截然不同的夫妇\((\textbf{x}_{1} ,\textbf{b}_{1})\)和\((\textbf{x}_{2} ,\textbf{b}_{2})\),\(\textbf{x}_{1} \neq\textbf{x}_{2}\),\(\textbf{b}_{1} \neq\textbf{b}_{2}\),属于相同的等价类,如果,对于\(i=1,2),中心光刺激\(\textbf{x}_{i} \)嵌入相应的背景中\(\textbf{b}_{i} \)诱导相同的感知颜色\(x\in\mathcal{P}\).Resnikoff不评论在这种非标准观测配置中,\(\mathcal{P}\)守恒正则凸锥的性质;这是一个极为重要的问题,将在Section中讨论。 3.3。目前,我们假设\(\mathcal{P}\)也是一个规则的凸锥。
如第。 2,我们定义了包含\(\数学{P}\)作为\(V=\mathcal{P}(P)-\数学{P}\)唯一的区别是,在Resnikoff的设置中,将对嵌入统一背景中的颜色刺激进行颜色匹配,而不是对独立的物理灯光进行颜色匹配。这需要一种Resnikoff没有讨论过的新的颜色匹配规范。
一旦建立了模型框架,我们就可以开始进行导致同质性公理的数学构造。首先,因为\(\mathcal{P}\)是嵌入三维实向量空间中的(正)锥V(V),\(\operatorname{Aut}(\mathcal{P})\)将由定向保护线性变换 V(V) 哪个保存 \(\mathcal{P}\)即
$$\operatorname{GL}^{+}(\mathcal{P}):=\bigl\{B\in\operator name{GL}(3,\mathbb{R}),\det(B)>0\text{和}B(x)\in\mathcal{P}\forall x\in\mathcal{P}\bigr\}$$
(11)
哪里\(\operatorname{GL}(3,\mathbb{R})\)被识别为可逆实群\(3次3次)行列式不同于零的矩阵,即\(\mathrm{M}(3,\mathbb{R})\cong\mathbb{R}^{9}\)属于\(\operatorname{det}^{-1}\{0\}\),由行列式函数求0的逆像,在欧氏拓扑中是连续的,因此\(\operatorname{det}^{-1}\{0\}\)已关闭,因此\(\operatorname{GL}(3,\mathbb{R})\)是的开放子集\(\mathbb{R}^{9}\)引入了正行列式的要求,以尊重圆锥各母线的方向\(\mathcal{P}\).
Resnikoff声称如果我们解释\(操作名{GL}^{+}(\mathcal{P})\)作为'背景照明的变化',或背景变换简而言之,然后是\(\operatorname{GL}^{+}(\mathcal{P})\)在\(\数学{P}\)是可传递的,因此\(\mathcal{P}\)均质圆锥体。他所用的论点遵循这一推理思路。首先,人们普遍认为,任何感知到的颜色\(x\in\mathcal{P}\)可以转换为任何“足够接近”的\(y\in\mathcal{P}\)通过适当改变背景照明,见图2用于此现象的图形表示。
因此,\(\mathcal{P}\)可以看作是关于群的局部齐次空间\(\operatorname{GL}^{+}(\mathcal{P})\)。请注意,这是不是物理属性颜色,但感知特征通常被称为彩色感应,参见示例[9,10,19]有关如何测量感应的更多详细信息。
我们现在需要一些拓扑方面的考虑。\(\数学{P}\)继承度量空间的结构V(V),被认为是三维欧几里德空间。局部同质性意味着\(x\in\mathcal{P}\),有一个开放的社区\(U_{x}\子集\数学{P}\)这样,每个\(y \在U_{x}\中)可以表示为\(y=B(x)\ in \ mathcal{P}\)对一些人来说\(操作名{GL}^{+}(\mathcal{P})\),所以的每个元素\(\mathcal{P}\)是一个内部点。要继续:\(\mathcal{P}\) 在中打开 V(V).
现在让我们结合公理3考虑局部同质性,即\(\mathcal{P}\):每两种感知颜色\(x,y\ in \ mathcal{P}\),线段我加入的x个到年完全位于\(\mathcal{P}\).局部同质性确保\(z以L计),有一个开放的社区\(U_{z}\子集\数学{P}\)这是关于群的齐次空间\(\operatorname{GL}^{+}(\mathcal{P})\).作为z(z)在以下方面有所不同我,我们得到了开放覆盖\(L}U{z}中的\bigcup_{z\)属于我,以及,自我是的紧子集\(\mathcal{P}\),我们可以提取有限的,有限的的开放式覆盖我即存在\(L\中的x_{1},\ldots,x_{n}),\(n<+\ infty \),因此\(\bigcup_{k=1}^{n}U_{x_{k}}\)是一个开放的覆盖我.
让\(B_{k}\in\operatorname{GL}^{+}(\mathcal{P})\)是携带的背景照明的变化\(x{k}\)到\(x{k+1}\),其中\(k=1,\ldots,n-1),\(x_{0}\等于x\)、和\(x{n}\equivy)那么,因为\(\operatorname{GL}^{+}(\mathcal{P})\)是一个群体,转变\(B\equiv B_{n}\circ B_{n-1}\cick\cdots\circ B_{1}\)携带x个到年即\(y=B(x)\)每两种感知到的颜色\(x,y\ in \ mathcal{P}\)因此,\(\mathcal{P}\)是一个\(\operatorname{GL}^{+}(\mathcal{P})\)-均匀空间。
有人可能会反对,从操作上讲,改变任何颜色感觉\(x\in\mathcal{P}\)任何其他人\(y\in\mathcal{P}\)通过背景光的单一改变,如果x个和年在色彩属性方面相距甚远。以下注意事项将阐明如何正确解释背景变换的构成。让我们再考虑一下图2并搜索转换B类这样的绿色感觉\(x\in\mathcal{P}\),\(x=[(\textbf{x}_{0},\textbf{b}_{0})]_{\sim}\)左侧图像中心的颜色刺激被转换为任意不同的颜色\(y\in\mathcal{P}\).第一次转型\(B_{1}\)例如,我们可以使用图右侧所示的2关键观察结果是,由于本节开头所述,黄色的感知颜色\(x_{1}\在\数学{P}\中),\(x{1}=[(\textbf{x}_{0},\textbf{b}_{1} )]_{\sim}\),\(\textbf{b}_{1} \neq\textbf{b}_{0}\),可以用另一对来表征\((\textbf{x}_{1} ,\波浪线{\textbf{b}}_{1})\)匹配的\(x{1}\)然后,通过明智地选择背景变化\(B_{2}\)关于\(x{1}\),我们可以把它变成一种颜色\(x_{2}\在\mathcal{P}\中),\(x{2}=[(\textbf{x}_{1} ,\textbf{b}_{2} )]_{\sim}\),感觉更接近年比\(x{1}\)。如前所述,\(x{2}\)可以用另一对来描述\((\textbf{x}_{2} ,\波浪号{\textbf{b}}_{2})\)以及第三次背景转换\(B_{3}\)可以在最后一个配置上操作,获得颜色\(x_{3}\在\mathcal{P}\中)感觉上更接近年比\(x{2}\)。通过重复前面的步骤,我们可以找到与所需颜色相匹配的颜色年当然,实验过程必须费力地进行,可能非常耗时,但上面讨论的数学论证保证了该过程可以在有限的步骤内完成。
在图中三我们报告感知到的颜色\(x{1},\点,x{5}\)通过上述过程获得的,其示出了如何通过背景变换的合成来逐渐向另一种颜色感觉移动颜色感觉。
到目前为止讨论的所有考虑都证明了为什么Resnikoff被引导假设他自己关于颜色空间结构的第五条公理。
公理1到5意味着\(\mathcal{P}\) 是开凸正则齐次锥(同样有联系的和可收缩的)嵌入三维向量空间V(V).
这些物体已经分类,这将使我们能够明确确定\(\mathcal{P}\)然而,我们将此分析推迟到Sect。 4在一段插曲之后,我们讨论了一个与背景变换的线性相关的重要问题。
3.3Resnikoff模型中的线性问题
背景光变化的传递作用\(\mathcal{P}\)已经在上面进行了广泛的分析。在这里,我们专注于他们必须实现的剩余属性。
当然每个B类保存\(\mathcal{P}\)因为在背景改变之后感知到的颜色仍然是这样的;此外,所有转换B类显然是可逆的,因为我们可以执行相反的改变,并返回到原来的颜色感觉。
然而,Resnikoff未能分析的一个关键问题是:不清楚为什么背景变化应该是线性的事实上,报纸上是Resnikoff本人[2]稍晚出版[1],声明此问题为“验证最少的方面他所考虑的一组转换。
数学上,线性背景变换\(操作员姓名{GL}(V))在\(\mathcal{P}\):
$$B(\alpha x+\beta y)=\alpha-B(x)+\beta-B(y),\quad\alpha,\beta\in\mathbb{R}^{+},x,y\in\mathcal{P}$$
(12)
在图中4我们概述了一个心理物理实验,以检查背景变换的可加性。可以使用类似的程序验证B类与缩放成线性关系。
考虑两个物理灯光x个,年以及它们的叠加\(\textbf{x}+\textbf{y}\),所有三个都嵌入到背景中b条.它们会引起色觉x个,年和,假设公式(4),\(x+y \).背景改变后B类从b条到\(\textbf{b}'\),由x个,年和\(\textbf{x}+\textbf{y}\)将成为\(B(x)=[(\textbf{x},\textbf{B}')]_{\sim}\),\(B(y)=[(\textbf{y},\textbf{B}')]_{\sim}\)和\(B(x+y)=[(\textbf{x}+\textbf{y},\textbf-{B}')]_{\sim}\)分别为。
然后考虑一个辅助背景\(\textbf{b}“”)并搜索物理灯光\(\波浪线{\textbf{x}}\)和\(\波浪线{\textbf{y}}\)嵌入\(\textbf{b}''),被视为\(B(x)\)和\(B(y)\)即\(B(x)=[(波浪线{\textbf{x}},\textbf{B}'')]_{\sim}\)和\(B(y)=[(\tile{\textbf{y}},\textbf{B}'')]_{\sim}\)分别是。因此\(\波浪线{\textbf{x}}\)和\(\波浪线{\textbf{y}}\)将给予\(B(x)+B(y)=[(波浪线{\textbf{x}}+\tilde{\textbf{y}},\textbf{B}'')]_{\sim}\).如果\(B(x+y)=[(\textbf{x}+\textbf{y},\textbf-{B}')]_{\sim}\)比赛\(B(x)+B(y)=[(波浪线{\textbf{x}}+\tilde{\textbf{y}},\textbf{B}'')]_{\sim}\),然后B类相对于辅助背景而言是相加的\(\textbf{b}“”)通过使用一组充分多样化的辅助背景重复测试B类关于x个,年和b条,\(\textbf{b}'\)已测试。最后,通过改变x个,年和b条,\(\textbf{b}'\),的可加性B类 兜售法院已测试。
在关于背景变化的线性假设得到实验证实之前,它仍然是Resnikoff模型的核心猜测。
如果这些变换被证明是非线性的,这不会使我们将在下一节讨论的Resnikoff的结果无效,这只意味着组\(\operatorname{GL}^{+}(\mathcal{P})\),应该对其起传递作用\(\mathcal{P}\),不能由背景照明的更改表示。另一方面\(\数学{P}\)看起来很合理,没有什么可以阻止其他(目前未知的)转换被传递作用于组的元素识别\(\mathcal{P}\).