使用机器学习算法为蜂窝子集合构成提供深层洞察

客观的

介绍一种适合于在CytoFLEX LX流式细胞仪上采集的20标记面板。在Cytobank平台上使用viSNE、FlowSOM和SPADE对数据进行可视化。本文将展示一种使用Kaluza分析的人工选门策略,并将其与使用Cytobank平台上的FlowSOM进行无监督聚类识别的子集进行比较。1,2许多这些算法的无监督性质减少了通过已知亚步骤的手动门控引入的偏差,并使研究人员能够识别意外的表型。与手动门控相比,使用机器学习算法实现高维数据集的详尽分析所需的动手时间所需的减少代表了额外的优势。

为了生成本应用说明中使用的数据,在按照标准程序(部分编号)使用Versalyse对红细胞进行裂解之前,血液样本用20色抗体鸡尾酒进行染色(见表1)IM3648)。在6个激光下获得染色样品CytoFLEX LX流式细胞仪.已经施加了下述过滤器配置以确保对每种染料的最佳检测。

表1.使用Cytoflex LX流量仪表的20个标记免疫蛋白酶的面板组成。

使用Cytoflex Lx流量仪表的20个标记免疫蛋白酶的面板组成

使用逻辑标度进行补偿和数据转换Kaluza分析软件并补偿,逻辑转换数据被导出到Cytobank平台使用Kaluza cytobank插件。Kaluza分析还用于双轴门控和手动人口鉴定。

在进行机器学习辅助数据分析的准备工作中,碎片、双元体以及死亡细胞或其他不需要的事件都会被清除。这些事件不会向下游分析添加信息,如果不适当识别和排除,可能会对数据显示产生负面影响,并混淆统计结果。根据所需的数据可视化和研究问题,预先确定感兴趣的人群以进行进一步分析可能有价值(图1)。

使用Kaluza准备ml辅助分析的数据

图1. Kaluza分析中的数据清理.根据前向散射信号面积与高度的对比,排除了双重信号,然后根据前向和侧向散射特征对白细胞进行门控。细胞阴性的ViaKrome 808(零件号C36628)被鉴定为活细胞,并根据CD45的表达进一步分类为白细胞。数据分析使用Kaluza分析软件。地块仅用于说明目的。


为了人工识别人类外周血样本中的细胞亚群,我们利用Kaluza分析软件建立了一种基于先前发表的标记表达模式知识的门控策略。3.

知识驱动人口识别的例子图2。主要白细胞子集的知识驱动识别.数据分析使用Kaluza分析软件。地块仅用于说明目的。



使用机器学习工具可以识别无偏差的蜂窝亚群,并且独立于先验知识。VISE的维度降低算法能够可视化在单个2D图中设置的高维数据中包含的信息。诸如FLWOSM的聚类算法算法能够基于标记表达中的相似性自动识别和组相似的小区。2

为了进一步分析数据集,使用viSNE对所有门控标记进行降维,这些标记也用于图2所示的手动门控步骤。这使得包含在这11个标记(CD45, CRTH2, CD123, CD15, CD14, CD16, CD56, CD3, CD4, CD8, CD19)中的信息可以在一个2D图中可视化。viSNE是一种将高维数据降至二维的方法,从而能够快速探索数据分析和复杂结果的可视化。对于流式细胞术数据,这可能有助于将事件/细胞分类为生物种群。表型相似的细胞会彼此靠近,形成一个岛。得到的viSNE地图的等高线图如图3A所示。

在减少维度降低之后,进行了流动分析以自动将细胞簇聚集成12个所谓的Metaclusters。在人口定义标记上运行流动并显示在Visne地图上覆盖的生成的聚类数据可以促进质量评估。如果需要进一步迭代调整算法运行设置以优化结果,则此可视化可以帮助比较不同的运行并提供用于分析聚类数据的起点。

在这里分析的数据集中,可以观察到Vise岛和流动性Metaclusters之间的良好相关性(图3b)。为了快速识别每个Metacluster的表型,可以通过聚类构建流动性Metaclusters的热图视图(图3c)。

子集识别使用viSNE, FlowSOM和热图显示图3.使用Visne,Flowsom和Heatmap显示器的子集识别。a)Visne地图b的轮廓图B)Visne地图与流动Metaclusters作为覆盖图C)通过Flowsom MetaCluster的标记表达的热图可视化。使用Kaluza Analysis Software对数据进行补偿和逻辑转换,并通过Kaluza Cytobank Plugin上传至Cytobank平台。Viske在11种人群定义标记上运行3个样品,3000个迭代,30个困惑和0.5θ。FlowSom设置是12个Metaclusters和121个群集,具有分层共识群集。地块仅用于说明目的。


通道功能点块颜色,颜色的每个事件viSNE地图根据其强度在通道内的数据集,可以用来表示为什么点在地图上相互附近或者标记表达式模式类似事件之间在viSNE岛。图4显示了viSNE图上CD19、CD4和CD8的标记表达,并与FlowSOM元聚类进行了比较。

viSNE图谱上亚群体标记的表达水平
图4. Visne地图上的亚潜素标记的表达水平。A)CD19表达B)CD4表达C)CD8表达式D)与流动性Metaclusters的Visne地图,如覆盖图。使用Kaluza Analysis Software对数据进行补偿和逻辑转换,并通过Kaluza Cytobank Plugin上传至Cytobank平台。Viske在Cytobank插件上运行11个种群,限定3个样品的标记,3000次迭代,30个困惑和0.5θ。FlowSom设置是12个Metaclusters和121个群集,具有分层共识群集。地块仅用于说明目的。

3个样品的ml辅助分析比较

图5. 3个样品的比较。a)覆盖Visne地图上的流量聚类,箭头表示Metacluster 1,Asterick表示MetaCluster 12b)CD16表达C)CD56表达。使用Kaluza Analysis Software对数据进行补偿和逻辑转换,并通过Kaluza Cytobank Plugin上传至Cytobank平台。Viske在11种群体上在Cytobank上运行,其中限定标记物在所有CD45 +白细胞上运行3个样品,3000个迭代,30次困惑和0.5θ。FlowSom设置是12个Metaclusters和121个群集,具有分层共识群集。使用Kaluza Analysis Software对数据进行补偿和逻辑转换,并通过Kaluza Cytobank Plugin上传至Cytobank平台。进一步的数据分析在Cytobank平台上进行。地块仅用于说明目的。

组合Visne和Flowsom允许通过可视化Visne地图上的特定标记的表达(图5)来进行定性比较。比较表明,鉴定为Metacluster 1的CD16 +群体(图5a,蓝色,箭头)在样品g中突出,但在样品B和F中实际上不存在。它还显示了Metacluster 12中的CD56亮细胞的丰富,用于样品F(图5 a,红色;星号)。

另一种可用于识别相似细胞组的无监督算法是SPADE。SPADE (Density-normalized Events的生成树级数分析)SPADE将表型相似的细胞聚集成一个层次,允许对异构样本进行高通量、多维度分析(图6)。可以添加气泡,为SPADE发现的各种计算种群(簇)指定用户定义的种群阈值。

CD16表达上色的锹树

图6. 2个样品的比较,CD16表达上彩色的铲子树。使用Kaluza Analysis Software对数据进行补偿和逻辑转换,并通过Kaluza Cytobank Plugin上传至Cytobank平台。SPADE在11个种群上运行,降采样至10%,50个节点。地块仅用于说明目的。

通过扩展人工门控策略,可以获得更深入的白细胞群体免疫图谱。同样,这通常基于表达模式的先验知识。图7提供了CD4+ t细胞子集的示例。

调节性t细胞及其亚群的知识驱动识别

图7.监管T细胞及其子集的知识驱动鉴定。(a)在CD4 + T细胞上栅极的CD4 T细胞存储器亚包,除了Tregs(B)和CD8 + T小区存储器子集。数据分析使用Kaluza分析软件。地块仅用于说明目的。

样本之间的比较可以通过比较图或统计结果,并利用叠加功能或Kaluza比较图(图8)来完成。这种方法通常也由对可能差异的假设来指导。

样本间Treg子集的比较
图8.特雷格子集跨样品的比较。A)每个样本单独的点图。B)信息表,每个样本和子集的统计结果。C)两个样本点图叠加。D)比较图可视化每个子集和样本的%门控。数据采用Kaluza分析软件进行分析。地块仅用于说明目的。



对于T细胞亚群的无监督鉴定,使用CD3 + T细胞作为输入群体进行Visne分析。图9a显示CD4和CD8在Visne地图上的表达。按照与之前相同的手动门控方法(参见图7),使用平底锅T细胞上的象限栅极识别不同的CD45ra和CD62L表达模式,并在VISNE地图上可视化(图9b)。最后,使用流量来执行分层共识群集以识别10个Metaclusters(图9c)。手动门控和无监督的聚类结果导致识别类似群体。

对T细胞亚群的无监督分析
图9。T细胞亚群的非监督分析。(a)在Cytobank平台上进行Vise,用2000次迭代,并且在得到的Visne图(b)CD62L和CD45Ra表达式(左)以及CD45ra表达式图案(左)上观察50和CD4(左)和CD8(右)表达的困惑。使用手动门控和覆盖在Visne地图上的人口来鉴定调节性T细胞(中间)。(c)使用归一化数据上的分层聚类进行流量聚类以检测100个集群和10个Metaclusters。MetaClusters显示在Visne地图上。使用Kaluza Analysis Software对数据进行补偿和逻辑转换,并通过Kaluza Cytobank Plugin上传至Cytobank平台。进一步的数据分析在Cytobank平台上进行。地块仅用于说明目的。

图10示出了使用手动门控和无监督群集的CD8 +内存子集识别的比较。

CD8 + T小区存储子集对手动门控与FLWOSOM的比较

图10。手动门控识别的CD8+ T细胞记忆子集的比较(A)和FlowSOM (B)。使用Kaluza Analysis Software对数据进行补偿和逻辑转换,并通过Kaluza Cytobank Plugin上传到Cytobank平台。进一步的数据分析在Cytobank平台上进行。地块仅用于说明目的。

概括

使用CytoFLEX LX上获得的20个标记面板获得的3个供体的数据显示了手动门控策略来识别白细胞亚群以及对T细胞亚群的深入分析。使用viSNE可视化高维数据在二维viSNE地图显示,并讨论了使用viSNE和SPADE比较样本。最后,将FlowSOM的自动聚类识别结果与人工门控结果进行了比较。机器学习工具,如viSNE, FlowSOM和SPADE可以帮助可视化高参数数据和在元胞子集的无偏识别。

成功的技巧

有关使用Kaluza分析软件的详细说明,请参阅Kaluza IFU C10986,可以访问Cytobank平台的详细说明.Cytobank.org。新利18luck2021足球欧洲杯买球平台本文档不会替换使用说明。

对这里进行的分析的更深入讨论是“使用机器学习算法探讨Cytoflex LX上的20色面板的高尺寸流式细胞仪数据示例的电位“ 和 ”利用Kaluza和Cytobank平台的联合力量“技术笔记。


参考

  1. Amir Ed,Davis KL,Tadmor Md,.Vise可以实现高维单细胞数据的可视化,揭示白血病的表型异质性。自然生物技术。2013; 31(6):545-552。DOI:10.1038 / NBT.2594。

  2. Van Gassen S, Callebaut B, Van Helden MJ,.Flowsom:使用自组织地图进行可视化和细胞计数数据的解释:Flowsom。细胞测定法。2015; 87(7):636-645。DOI:10.1002 / CYTO.A.22625。

  3. Orolani C.抗原。在:血液恶性肿瘤的流式细胞术。John Wiley&Sons,Ltd;2011:1-157。DOI:10.1002 / 9781444398069.CH1。

  4. 邱平,Simonds EF, Bendall SC,.用铲子从高尺寸细胞仪数据中提取细胞层次结构。自然生物技术。2011; 29(10):886-891。DOI:10.1038 / NBT.1991。

仅供研究使用。不用于诊断过程。