关于脑中三维模型

一些很重要的讨论,用(AI 眼中的)脑科学去证明大量感性经验的重要性(终于和哲学统一起来了不是?),以及破除透视万能论——学过透视就能画一切东西这一迷信。

我从未想到我又能把这事儿扯到马克思主义的认识论上……

关于脑中三维模型

关于在脑子里建立三维模型这一点,脑科学究竟怎么说?我目前的想法是:

  1. 这个三维模型是抽象的,离散的,不连续的,模糊的,不能直接类比为 3D 软件中的模型,
  2. 这个三维模型,本质上是我们以一系列二维的图像拼凑起来的,本质上实际上不能说有这么一个三维模型,只是它表现为一个类似三维模型的东西,可以缩放,旋转
    1. 这个就真的是大胆假设了……我目前看过的材料没有这么说的,但我凭我自己的这些许经验有如此感觉,而其他的想法其实都是基于这个感觉
    2. 可以把这些二维图像想象为关键帧,大脑插值得到我想要的角度的图像,
    3. 当然,这里得到的图像仍旧只是一个印象,在后续的绘制中它逐渐变得精确
    4. 这个好像脑科学中叫 视图依赖表征 view-dependent representation
  3. 这个三维模型是迭代的,随着我对此物体的反复练习能够变得精细,但仍旧离散不连续,面对不常见角度的旋转仍旧会抓瞎,需要更多参考或探索
  4. 我对当前所画的物体会建立一个相对更精细,更片面的三维模型,这个三维模型随着当前绘制进度不断迭代细化,并指导我进一步的绘制;这个三维模型和当前画布是一个辩证统一的关系——三维模型指导我安排形状,我探索的形状细化这个三维模型
    1. 即,内部模型指导输出,输出反过来塑造模型

AI 同意上述所有观点。所以,大脑里确实没有一个真正的三维模型,只有一系列所画物体各角度的二维视图

是否能通过探索去学习结构

如果上面的所有想法均是正确的,那下一个问题是,我能否通过画笔的探索去学习物体的结构,即使在没有参考的情况下?我做一个形状,检查它是否符合我的预期——即表达了我想要的形体,如何调整,然后修正,这样我就做出来我从前从来没画过的东西,同时对这个东西也加深印象?

(当然,我知道通过透视图去研究是能够做到这个的,比如对物体的一个照片,能够得到物体的三视图,然后基于线性透视学去绘制任意角度)

AI 似乎同意能通过探索掌握新东西……所以,无参考学习确实是可能的,所掌握的新的东西其实本质上已经被大脑掌握过——有过这样的感性经验可以作为判断的依据。这同时也指出了它的局限——感性经验。

所以,这里可以有一个质变点——对一个物体有了足够多感性经验后(显然,某些感性经验必须通过画笔取得),便能够通过探索去补全缺乏感性经验的角度,并作为新的感性经验。就像我原本背单词,现在能根据语法规则和大量的积累猜词义。

而上面的一切讨论,证明了我当前正在操作的,进行大量有参考的速写这一学习方法重要性……在过去我对此实际上没有意识到这一点,我迷信脑子里的三维模型,期待能通过大量思辩(程序员的坏毛病),少量的对特定角度的研究就能知其全貌。而科学证明,没有这么一个 3D 模型,只有一个图像数据库,大脑临时从中拼凑出某个角度的画面。因此,(用画笔)向这个数据库中插入大量图像(即大量的感性经验)是必要的。

这里必须强调——不要以为只要多画,就能自动地掌握什么东西——必须要思考,大脑必须要受苦,不如此不能改造自身

经验即嵌入向量

但是,考虑一个问题——我速写时,看到什么画什么,不管背后究竟有啥空间结构,纯粹平面思维,vs 每次都思考和主动建模物体实际的空间结构,问为什么,这两者的训练效果必然将会有明显差异。所以,大脑保存这个二维图像,其实也编码了一些其他信息,如我最关心的空间关系。

更进一步,实际上图像本身它就不存在,存在的只是图像编码后的信息,就像机器学习中所谓的嵌入向量

而从嵌入向量这个比喻去思考,我们光看图,或者用看到什么画什么的思路去临摹图,我实际上就是插入了低质量,低维度的嵌入向量,意义不大。明显地,我如果是为了训练空间关系,我就需要增加更多包含空间关系的嵌入向量,即在练习时用空间思维去思考(当然,形状思维同样要参与)。

嵌入向量这个类比也可以扩展到马克思主义的实践论上——我如果想要知道梨子是什么味道,就必须变革梨子,亲自尝它一尝,这样才能得到最高质量,最丰富维度的嵌入向量,否则道听途说只能得到低质量,低维度,且可能错误的嵌入向量(虽然自己的实践也不一定是正确啦,再说这里的正确也只是相对真理……我又在绕圈子了,打住)。


本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 协议 ,转载请注明出处!