## 启发 NPI文章试图构建一个虚拟代理脑,从而获取EC 矩阵。通常获取 EC 需要真实刺激,但人脑做不了全脑刺激。NPI 的做法是:用一个人工网络当“替身大脑”,它只做一件很朴素的事,一步预测。论文摘要明确说它用 ANN 去拟合大尺度神经动力学,然后在替身大脑里逐个区域施加扰动,看别的区域怎么响应,从而得到方向、强度、兴奋/抑制属性的全脑 EC。这个神经网络的实现就是 MLP 两个隐藏层,而且前三步预测下一步。 因果图在其中不是网络直接输出,而是模拟一个刺激,对网络做虚拟刺激实验读取出来的。另一篇MultiCell的内容,并不是利用一个巨大的模型去端到端逐像素生成未来形态,而是聚合颗粒视角和泡沫视角的细胞表示,统一表示为图结构,再作节点、边或者整体层面的预测。最上面这篇则是之前汇报过的,利用采样策略解决不同数据之间的批次效应,间接地去做对齐,同样可以有很好的效果。 当然类似的文章是不少的,综合这些文章,对我直接的启发就是这两条线索: NPI还是Multicell实际上都是强调系统的状态是什么,这个状态定义的越完善,后续建模的难度就越小,所以这不仅仅是前处理,而是建模的核心接口。 MultiCell和分批采样策略,前者本质上是在做几何归一化,后者则是通过采样策略避免模型将批次效应当作特征,他们的思路概括出来,都是在模型前面就解决困难,而非将所有困难都交给模型去学习。 ## 任务本身 我今年首先做的事把数据处理链路跑通,能得到细胞核的轨迹和分裂事件,有关虚拟胚胎这个方向呢,很多文献里很多方法都是做事件预测和时间外推。但胚胎真正的对象是一个随时间变化的状态,里面同时有位置、邻接关系和谱系关系,完全可以利用这些信息,去补充或者丰富显微任务。比如低分辨率图像的高清复原,或者实时标注细胞状态和谱系,所以我做了一个简单的调研。 任务本身的核心问题就是, 细胞状态建模呢,有很多类型, 比如基于物理规则的模型, 以前最流行的是经典能量模型,根据细胞的形态参数计算细胞每时每刻的运动趋势,其中能量项负责形状与连接,耗散项负责运动的阻力与动量守恒,从而模拟细胞的运动状态。 另一个是将细胞膜表示成闭合的三教网格曲面,也使用能量势函数表达细胞接触面的力学状态,比如体积相关能量、面积张力和弯曲能量,间接使得系统的动力学趋向平衡 接着有纯数据驱动的学习模型,像MultiCell这一篇 本质是将3D体数据经分割后表示成图对象,并且将模型的输入限制在一组刚体旋转不变的量上,并且也将动力学信息输入进去,就是某些量的差分。 另外有小鼠的数字孪生胚胎,核心是将真实胚胎在一个极短的发育窗口内,做成一个可以在电脑里任意切片、放大、查基因、看细胞类型和信号通路的 3D 数字孪生体,做法很直接也很硬,做的数字重建 额外还有一类比较特殊的模型,假设每个细胞都是独立个体,为细胞赋予局部规则反复更新。这个方法是最早的数字生命体,可以用来模拟生物学和物理学中的复杂系统,但手动设定规则局限性较大。但如果给细胞引入独立的神经网络模型,让模型学习规则并自更新,有希望构建出可以真正学习到发育规则的模型。比如右边的jax衍生工作,将组织看作软球细胞,每个时间步都会生长、力学重排和分裂,并有化学扩散作为通信渠道。使用常微分方程或者随机微分方程去调控每个细胞的任意特性,例如基因表达、代谢物浓度、细胞大小、分裂概率等。 最后是在虚拟胚胎中的一些结果,实际上,最开始仅仅是想通过细胞的3D+时序信息去预测下一个时刻的胚胎细胞位置,后来发现,这个预测效果是比较差的,进而去考虑更多的细胞状态。这部分是目前在做的, Loading... ## 启发 NPI文章试图构建一个虚拟代理脑,从而获取EC 矩阵。通常获取 EC 需要真实刺激,但人脑做不了全脑刺激。NPI 的做法是:用一个人工网络当“替身大脑”,它只做一件很朴素的事,一步预测。论文摘要明确说它用 ANN 去拟合大尺度神经动力学,然后在替身大脑里逐个区域施加扰动,看别的区域怎么响应,从而得到方向、强度、兴奋/抑制属性的全脑 EC。这个神经网络的实现就是 MLP 两个隐藏层,而且前三步预测下一步。 因果图在其中不是网络直接输出,而是模拟一个刺激,对网络做虚拟刺激实验读取出来的。另一篇MultiCell的内容,并不是利用一个巨大的模型去端到端逐像素生成未来形态,而是聚合颗粒视角和泡沫视角的细胞表示,统一表示为图结构,再作节点、边或者整体层面的预测。最上面这篇则是之前汇报过的,利用采样策略解决不同数据之间的批次效应,间接地去做对齐,同样可以有很好的效果。 当然类似的文章是不少的,综合这些文章,对我直接的启发就是这两条线索: NPI还是Multicell实际上都是强调系统的状态是什么,这个状态定义的越完善,后续建模的难度就越小,所以这不仅仅是前处理,而是建模的核心接口。 MultiCell和分批采样策略,前者本质上是在做几何归一化,后者则是通过采样策略避免模型将批次效应当作特征,他们的思路概括出来,都是在模型前面就解决困难,而非将所有困难都交给模型去学习。 ## 任务本身 我今年首先做的事把数据处理链路跑通,能得到细胞核的轨迹和分裂事件,有关虚拟胚胎这个方向呢,很多文献里很多方法都是做事件预测和时间外推。但胚胎真正的对象是一个随时间变化的状态,里面同时有位置、邻接关系和谱系关系,完全可以利用这些信息,去补充或者丰富显微任务。比如低分辨率图像的高清复原,或者实时标注细胞状态和谱系,所以我做了一个简单的调研。 任务本身的核心问题就是, 细胞状态建模呢,有很多类型, 比如基于物理规则的模型, 以前最流行的是经典能量模型,根据细胞的形态参数计算细胞每时每刻的运动趋势,其中能量项负责形状与连接,耗散项负责运动的阻力与动量守恒,从而模拟细胞的运动状态。 另一个是将细胞膜表示成闭合的三教网格曲面,也使用能量势函数表达细胞接触面的力学状态,比如体积相关能量、面积张力和弯曲能量,间接使得系统的动力学趋向平衡 接着有纯数据驱动的学习模型,像MultiCell这一篇 本质是将3D体数据经分割后表示成图对象,并且将模型的输入限制在一组刚体旋转不变的量上,并且也将动力学信息输入进去,就是某些量的差分。 另外有小鼠的数字孪生胚胎,核心是将真实胚胎在一个极短的发育窗口内,做成一个可以在电脑里任意切片、放大、查基因、看细胞类型和信号通路的 3D 数字孪生体,做法很直接也很硬,做的数字重建 额外还有一类比较特殊的模型,假设每个细胞都是独立个体,为细胞赋予局部规则反复更新。这个方法是最早的数字生命体,可以用来模拟生物学和物理学中的复杂系统,但手动设定规则局限性较大。但如果给细胞引入独立的神经网络模型,让模型学习规则并自更新,有希望构建出可以真正学习到发育规则的模型。比如右边的jax衍生工作,将组织看作软球细胞,每个时间步都会生长、力学重排和分裂,并有化学扩散作为通信渠道。使用常微分方程或者随机微分方程去调控每个细胞的任意特性,例如基因表达、代谢物浓度、细胞大小、分裂概率等。 最后是在虚拟胚胎中的一些结果,实际上,最开始仅仅是想通过细胞的3D+时序信息去预测下一个时刻的胚胎细胞位置,后来发现,这个预测效果是比较差的,进而去考虑更多的细胞状态。这部分是目前在做的, 最后修改:2026 年 01 月 29 日 © 允许规范转载 赞 2 如果觉得我的文章对你有用,请随意赞赏