乳腺肿瘤异质性的分子定义

乳腺肿瘤异质性的分子定义

概要:

有明显包括干细胞状属性表型的细胞被提出存在于正常的人类乳腺上皮和乳腺癌,但他们的详细的分子特征和临床意义尚不清楚。我们通过使用优先与干细胞状属性相关联的标记确定了从癌细胞和正常乳腺组织中纯化出的细胞的基因表达和遗传图谱。来自不同个体肿瘤的CD24 +和CD44 +细胞是相关的同源细胞,但并不总是完全相同的。CD44 +细胞特异的基因包括许多已知的干细胞标志物基因及与降低病人存活率相关的基因。TGF-β通路是专门活跃在CD44 +癌细胞中的,其抑制剂诱导产生更上皮样的表型。我们的数据显示了CD44 +细胞和不同的肿瘤细胞群体治疗靶点的预后的相关性。 介绍:

虽然起源于正常细胞的肿瘤由于积累了遗传的和表观遗传学的改变,但是肿瘤起始细胞的身份很大程度上是未知的。干细胞已经被提议作为具有吸引力的目标,这是因为他们与癌细胞有很多相同的特征,包括自我更新的能力、产生异构的后代并且迁移侵入周围组织。与此相关联的, 正常干细胞功能所需的几个通路和基因在肿瘤细胞中被激活并且在肿瘤发生中发挥重要作用。癌症干细胞被定义为具有干细胞状属性的肿瘤细胞的一个子集, 干细胞状属性被认为是负责肿瘤生长、恶化、复发的。许多年前提出了这个假说且近年来通过新的实验方法得以复兴。通过频繁地使用细胞表面标记物特异的标记来自相同器官的正常干细胞,假定的癌症干细胞已被从各种人类的肿瘤类型中纯化出来了。通过在体外克隆性和体内致瘤性的研究中的演示,这些孤立的细胞的致瘤性和“干细胞特性”已经被证明了。

人类乳腺上皮细胞分化的阶段和独特的识别分化细胞和祖细胞的标记物是没有明确定义的。体外克隆性研究表明双极的祖细胞的存在能增加腔上皮和肌上皮细胞、谱系限制性腔上皮细胞和肌上皮细胞的祖细胞,以及分化的腔上皮和肌上皮细胞。MUC1和CD10(CALLA/ MME)被认为是分别由腔上皮细胞和肌上皮细胞表达的。CD44是出现在祖

细胞中,然而在正常人类乳腺中上皮细胞表达CD24尚未确定。在乳腺癌中,Al-Hajj等人证明了来自于乳腺癌患者的恶性胸腔积液的Linˉ/ CD44 + / CD24ˉ / CD24低(后来归类为CD44 +)细胞在NOD/SCID小鼠中比在CD44 / CD24 +(后来归类为CD24 +)细胞中具有更多的肿瘤发生,结果xenografts复制原始肿瘤的异质性, 从而产生CD44 +细胞是乳腺癌干细胞的假设。随后在乳腺癌和前列腺癌的研究中证实,CD44 +细胞是肿瘤发生细胞,当将其注入免疫缺陷小鼠时则产生祖细胞状的性状。所有这些研究都没有分析复杂的分子结构和临床CD44 +细胞和 CD24 +细胞的相关性或提供确凿的证据证明CD44 +肿瘤细胞是干细胞且CD24 +肿瘤细胞是他们的后代。此外,癌症干细胞和肿瘤恶化基因克隆发展的假设之间的关系也没有被研究。

为了着手解决这些问题,我们使用CD44和CD24从乳腺癌组织中纯化出了细胞并且确定了他们全部的基因表达和基因图谱。相比之下,我们也从正常人类乳腺上皮分离特化了CD44 + 和CD24 +细胞。CD44 +乳腺癌细胞特定的基因标签被优化为已知的干细胞标记物和相关的临床结果以及信号通路的活跃性,但癌症的CD44 + 和CD24 +细胞并不总是基因完全相同的。

结果: 净化和基因表达谱数据不同的乳腺上皮细胞群

我们使用在分化的细胞或具有干细胞性状的细胞中有特异表达的细胞表面标记纯化了正常乳腺上皮和乳腺癌细胞不同的细胞亚群 (图1A)。我们从来源于乳房缩小整形术和不同时期的乳腺肿瘤的正常人类乳腺组织中纯化出了CD44 + 和CD24 +细胞。基于最初的从胸膜积液和腹水样本纯化出的CD44 +细胞的基因表达图谱,我们发现了一个CD44 +细胞特异的基因(PROCR),它编码一个细胞表面受体,并且与同样表达在白细胞和肌纤维的CD44细胞相比更特异的表达于CD44 +上皮细胞。PROCR已被作为一种造血、毛囊、神经和胚胎干细胞的标记。在证实100%的CD44 +肿瘤细胞呈PROCR阳性后 (数据没有显示),我们使用这个标记从主要入侵的乳腺肿瘤中分离CD44 + / PROCR

+(后来归类为PROCR +)细胞 (参见在补充数据中可提供的这篇文章的在线数据中的图S1A)。在补充数据中提供了纯化过程和组织样品的详细描述。 图1. 不同细胞亚群的纯化和基因表达分析

(A)来自正常乳腺组织和侵入性转移性乳腺癌癌组织的各种细胞的纯化原理图解。使用对每个细胞类型特异的抗体耦合磁珠捕获细胞。有矩形框的纯化步骤并不总是包括在流程中,而标有星号的肌纤维只存在于侵入性肿瘤。IDC表示浸润性导管癌。分离于正常乳腺组织的纯化后的细胞片段的半定量PT-PCR分析 (N1)(B)胸腔积液(PE2)(C)主要浸润性导管癌(IDC28)(D) 来自于CD24+,CD44+和PROCR +细胞的RNA的已知分化(Diff)和干细胞特异基因的表达检测。CD44+和PROCR +细胞缺乏分化标记且呈干细胞标记物阳性。在主要的侵入性肿瘤,CD44 +片段被白细胞污染了,说明它有高水平的CD45白细胞共同抗原(PTPRC)的表达。ACTB作为上样对照。每个三角形表明一个PCR循环的增加(25、30、35)。(E) 来自CD44+、PROCR+和CD24 +细胞的SAGE库的系统树图描绘了其相关性。层次聚类应用于SAGE数据显示的库,并且聚类热图选定的部分显示在这里。每一行代表一个标签,并且用最佳匹配那个标签的基因符号标记 (或“不匹配”如果没

有发现匹配的记录)。红色和绿色分别显示高和低的表达水平。正常的和肿瘤的CD44+和PROCR+细胞的表达图谱之间比那些来自同一个组织的CD24+细胞更相似。ASC,腹水;PE,胸腔积液;N,正常;IDC,浸润性导管癌。(F)基因本体生物过程类别高度代表了来自不同的细胞类群的SAGE库。至少在一个库中,使用DAVID功能注释工具绘制的类别的富集得分> 2。细胞类群代表包括癌症CD44+和PROCR+(红色),正常的CD44+和PROCR+(粉色)、癌症CD24+(深蓝色)和正常的CD24+(浅蓝色)细胞。

我们使用白细胞,管腔上皮细胞,肌上皮细胞和干细胞标记物通过半定量的RT-PCR证实了纯化和分化状态的细胞分数 (图1B-1D和图S1B)。已知的腔上皮细胞和干细胞的标记分别在CD44 +和 CD24 +细胞中有接近互斥地专一的表达,这表明他们可能的确分别代表腔上皮和祖细胞状的细胞。正常乳腺组织和乳腺癌组织的CD44+细胞中都存在低丰度的雌激素受体α(ESR1),意味着这些细胞对雌激素没有反应(图1B-1D和表1Ⅱ)。在正常CD44 +细胞中雌激素和孕激素受体以及ERBB2的缺乏进一步证明这些细胞可能代表祖细胞,因为鼠乳腺上皮干细胞不表达这些蛋白质。我们还分析了包括BMI1和刺猬(Hh)-信号通路基因在内的与自我更新相关的基因的表达。Gli2 和Gli1在CD44 + 细胞中比在CD24 +细胞中表达量更多,这反映了(Hh)信号的活性,而BMI1在两种细胞中的表达本质上是相同的 (图S1C和S1D)。

为了确定纯化细胞全面的基因表达图谱,我们从纯化于从乳腺癌患者体内收集的正常乳腺上皮细胞和胸腔积液、腹水以及原发性浸润性肿瘤样本的CD44 + 和CD24 +细胞中生成了SAGE(基因表达的系列分析)库 (具体描述见补充数据)。我们给每个SAGE库分配了一个基于样本和用于纯化细胞的细胞表面标记的名称。SAGE数据进一步支持了假设CD44 + 和CD24 +细胞分别代表更多分化的腔上皮和祖细胞状细胞,因为在各自的SAGE库发现已知的这些细胞的标记几乎是相互专一的 (表1i和1ii和表s1-s6)。SAGE库在无监督下的层次聚类证明正常的和癌症的CD44 +和PROCR +细胞之间要比同来自同一组织

的CD24 +细胞更相似 (图1 E)。在各种SAGE库中基因功能的分类表 表1.选择的基因在CD44+或PROCR+ 和CD24+细胞之间的差异表达

匹配的SAGE标签序列, 在每个指明的SAGE库中计算每200000个标签,并且列出了基因符号和为基因编码已知的干细胞(Ⅰ)或分化(II)细胞标记物或TGF-β通路组件和目标物(III) 的描述。N,正常;PE,胸腔积液;ASC,腹水;IDC,浸润性导管癌。 达揭示癌症的和正常的

CD44 +和PROCR+细胞含有更丰富的参与细胞运动、趋化性、止血、血管生成的基因,而CD24 +细胞更多的高度表达的基因与碳水化合物代谢和RNA剪接有关(图1 F)。

在CD44 +和 CD24 +乳腺癌细胞中基因的改变

为了确定个体肿瘤内CD44 + 和CD24 +细胞的克隆关系,对从这些细胞分离出的基因组DNA进行了SNP序列分析。结果数据显示,在

图2. 不同的肿瘤细胞亚群遗传图谱分析

(A) 对来自同一患者的存在于分离于胸腔积液(PE2和

PE6)和浸润性导管癌(IDC31)的CD44+ CD24+和PROCR+细胞中的正常白细胞的拷贝数量相对改变的SNP阵列分析。PROCR+*细胞是经CD44抗体进一步选择后的PROCR+细胞。红色和蓝色分别表明拷贝数量的增加和减少。来自每个肿瘤的一对不同的细胞类群总体似乎有相同的拷贝数变化。Chr,染色体。

(B) 分别使用具有成对的FITC和PE的抗CD24和抗CD44抗体对初级培养的胸腔积液(pcPE)CD44+和CD24+细胞进行的FACS分析。在CD44+和 CD24+细胞中CD44和CD24是相互排斥表达的。

(C) 使用BAC RP11-157A11标记到1q21.3(绿色)和BACCTD-2349A18标记到8q24.3(红色)对来自初级培养的胸腔积液(pcPE)CD44+和CD24+细胞的中期染色体和间期核进行的FISH分析。有8q24.3特异探针的FISH显示在所有三个细胞

片段中一个在这个位点重排的杂交模式特点(两个更亮,更大的和两个更弱,更小的信号)。有1q21.3特异探针的FISH显示在中期染色体和间期核中有多个信号(4-7),特征是来自染色体1长臂(q)的染色体物质的获得。

(D) 使用BAC RP11-157A11标记到1q21.3和1号染色体着丝粒(cen)探针(D1Z5)对未培养的胸腔积液(PE)CD24 +细胞进行的FISH分析。有代表性的间期核显示有多个对1q21.3位点(绿色)特异的杂交信号以及三个和四个对着丝粒区(红色)特异的杂交信号,这符合染色体1物质的增加。

一些肿瘤中两种细胞片段有相同拷贝数的改变,似乎他们是基因完全相同的(图2A)。为了分析CD44 + 和CD24 +细胞在单细胞水平下的基因组成,我们提出了一个供他们短期体外培养的方案, 就是根据细胞表面和细胞类型特异的标记的分析来维持他们的表型 (图2B和4C)。这些初级的培养被用于中期FISH分析,该分析使用BAC探查相应的染色体区域,这些区域在乳腺癌中经常被放大并且包含肿瘤

CD44 +或CD24 +细胞中特异地高表达的基因。这个分析确定了基因改造对于所有的细胞片段(8q24.3重排)来说是常见的,并且发现了仅在CD24 +细胞中有的一个基因改造(1q21.3增加)(图2C)。在所有CD24 +细胞中都能发现这种独特的基因变化, 并且这样的变化也存在于原始肿瘤中 (图2D)。因此,我们确定个体肿瘤内的CD44 + 和CD24 +细胞是具有相关同源性的,但CD24 +细胞可以有额外的不出现在CD44 +细胞的基因变化。

活跃于CD44 +细胞中的信号通路

为了识别基于我们SAGE数据的在CD24 +或CD44 +细胞中具有特异活性的信号通路,我们利用了最近应用于高通量数据的功能分析的MetaCore数据挖掘技术。首先,我们排列了基因实体的功能过程和规范的途径,根据统计显著适合于与相应的CD24+细胞SAGE库相比在正常或癌症CD44 + 细胞SAGE库中含量最高的基因的表达 (图S2A和S2B及未显示的数据)。在基因实体功能过程中,细胞运动、细胞粘附、蛋白质的生物合成、蛋白质折叠和细胞增殖强烈地适应正常CD44 +细胞中的基因上调以及癌症CD44 +细胞中的基因上调。细胞

运动和细胞粘附在此分析中有高的色散分数,这表明每个过程中不同的基因在癌症和正常CD44 +细胞中是上调的。在典型的途径中,TGF-β和WNT信号、细胞骨架重塑,整合素介导的过程, ephrin B反向信号以及趋化因子和细胞粘附强烈地适应正常CD44 +细胞中的基因上调以及癌症CD44 +细胞中的基因上调。图S3和S4描述了参与TGF-β和WNT信号、细胞骨架重塑以及更详细的TGF-β通路的基因。 图3. 在癌症CD44+细胞中TGF-β信号通路的调节网络

在癌症和不正常的CD44 +细胞与相应的CD24 +细胞相比以TGF-β为中心的直接交互网络基因上调。线的颜色显示抑制(红色),激活(绿色)及没有明确的关系(灰色)。

我们也使用了MetaCore数据挖掘技术对CD44 +和 CD24 +细胞中通过在表达基因间建立直接的交互(DI)网络来差异调节的途径进行更详细的分析,这些基因在正常或癌症CD44 +细胞SAGE库中的表

达量比相应的CD24 +细胞SAGE库多。在癌症CD44 +细胞特异的基因间DI网络的建立是以TGF-β1为中心的(图3和图S5)。TGF-β1中的发动蛋白、纤连蛋白、小窝蛋白及酪蛋白激酶Ⅱ组分仅仅在癌症

CD44 +细胞中是上调的,而胶原蛋白1和转录因子HIF1A和ETS1组分在癌症和正常的CD44 +细胞中都是上调的(图S6和S7)。正常CD44 +细胞特异的基因间建立的DI网络是以VEGF-A、IL-1、NF-kβ、AP-1、Rac1、SMAD3、功能激活的Notch通路和TGF-β3为中心的(图S8、S10和S13)。癌症CD44 +细胞特异基因的DI网络的一个亚网络以包含乳腺癌相关基因在内的TGF-β1为中心,如图S9所示,以及来自于个体癌症样本的CD44 +细胞的上调表达基因的附加网络的建立如图S11、 S12、S14和S15所示。

乳腺癌CD44 +细胞中的TGF-β通路

由于已知的TGF-β信号通路在调节人类胚胎干细胞的多能性中的重要性;它在分化、肿瘤发生、转移中的作用;以及我们的SAGE(表1Ⅲ)和MetaCore数据暗示这条通路在CD44 +细胞中,所以我们进一步详细地调查了它在乳腺癌CD44 +细胞中的作用。我们在CD44+和CD24 +细胞中通过半定量RT-PCR分析了参与TGF-β信号通路的选择基因的表达 (图4A)。与我们的SAGE和MetaCore数据相关, TGF-β1在肿瘤CD44 +细胞中与TGFBR2一起几乎完全表达, TGFBR2是TGF-β所需的一个信号受体 (图4A)。在肿瘤CD44 +和 CD24+细胞之间的引人注目的TGFBR2 mRNA水平的差异显示这个基因潜在的加强表观遗传调控。染色质修饰和启动子甲基化被描述为导致一些肿瘤中

TGFBR2沉默的潜在的机制。我们分析了肿瘤CD44 + 和CD24 +细胞中TGFBR2的DNA甲基化状态并且确定在CD24 +细胞中TGFBR2是高甲基化的,这就潜在的解释了TGFBR2在这些细胞中表达缺乏的原因(图4 B)。这个结果也表明,肿瘤CD44 +和 CD24 +细胞是表观遗传学截然不同的, 更多广泛的分析证实了这个发现。

为了测试在癌症CD44 +细胞中TGF-β信号通路活性的功能相关性,我们研究了双重TGFBR1 / TGFBR2激酶抑制剂(LY2109761)对体外培养的CD44 + 和CD24 +细胞生长分化的影响。首先,我们证实了TGF-β通路的组件和细胞类型特异的基因的表达在初级培养时是相同的,就如新鲜的不受TGFBR抑制剂治疗影响的肿瘤样本一样(图4

图4. 在肿瘤CD44+和CD24 +细胞中的TGF-β通路

(A) 参与分离于胸腔积液

(PE2)和腹水(ASC3)的CD44+和CD24+细胞中的TGF-β信号通路的基因的表达的半定量RT-PCR分析。TGFB1和TGFBR2在CD44 +细胞中是超表达的。GAPDH是用作上样对照。每个三角形表明PCR循环数越来越多(25、30、35)。

(B) 在来自初级培养的胸腔积液(pcPE)或新鲜的分离于浸润性导管癌(IDC)肿瘤样本的CD24 +(白色条)和CD44 +(黑色条)细胞的TGFBR2启动子的定量的

甲基化特异的PCR(qMSP)分析。

(C) 参与初级培养的胸腔积液(pcPE) CD44 + 和CD24 +细胞中TGF-β信号通路和干细胞功能的基因的表达的半定量RT-PCR分析。TGFBR2,GJA1和PROCR仅发现于CD44 +细胞,而SMAD2和 TGFBR1的表达在两个细胞群中是相同的。ACTB作为上样对照。每个三角形表明PCR循环数越来越多 (25、30、35),用颜色指示细胞培养中缺乏(白色)或存在(黑)TGFBR抑制剂。

(D) TGF-β和TGFBR抑制剂存在与缺乏的条件下,初级培养的胸腔积液(pcPE) CD44+和CD24+细胞的SMAD2/3和phospho-SMAD2/3蛋白质含量的免疫印迹分析。

(E) 用TGFBR抑制剂处理前后的初级培养的胸腔积液(pcPE)CD44+和CD24+细胞中的β-连环蛋白,E-钙粘素和ZO-1的表达和细胞定位的相差(PC)图像和免疫荧光分析。随着抑制剂的处理,CD44 +细胞经历了显著的形态学改变和β-连环蛋白,E-钙粘素和ZO-1在细胞膜的重新分配,而CD24+细胞显示没有响应。

(F) TGFBR抑制剂处理前(黑线)和处理后(红色线)的初级培养的胸腔积液(pcPE) CD44 +和 CD24 +细胞的细胞周期图谱。抑制剂对每一细胞类型的增殖没有影响。

C)。我们也证实, TGF-β信号通路只是在CD44 +细胞作为对TGF-β处理的响应而被激活,并且这个通路受到SMAD2/3的磷酸化决定的TGFBR抑制剂的抑制(图4 D)。CD24 +细胞表现出高的基本的

phopho-SMAD2/3水平,这可能是由于激活素信号的作用或TGFBR1存在突变。紧接着,我们分析了是否TGFBR抑制剂处理影响了CD44 + 和CD24 +细胞的表型或增殖。这种处理导致CD44+细胞在24小时内产生了引人注目的形态学变化 (图4 E)。TGFBR抑制剂处理过的CD44 +细胞在外观更呈现出上皮状,而未经处理的CD44 +细胞则呈圆形和分散状(图4 E)。为了确定这种形态学变化是否是抑制剂诱导的上皮状分化的结果,我们通过免疫荧光法分析了β-连环蛋白、E-钙粘素和ZO-1(图4 E)。TGFBR抑制剂处理导致这三种蛋白质在细胞膜上的定位符合上皮细胞在此诱导下的表型。这些结果证明TGF-β途径在

CD44 +乳腺癌细胞中被特异激活,并且它至少在某种程度上调节他们

表2. 有预计价值的CD44+和PROCR +或CD24 +癌细胞特异的基因标签

匹配的SAGE标签序列, 在每个指明的SAGE库计算每200000标签,并且为标签“A”和“B的基因列出了基因符号和描述。与癌症CD24 +细胞SAGE库相比所有癌症CD44 +和PROCR +细胞SAGE库的这些基因分别是统计上显著上调和下调的。

N,正常;PE,胸腔积液;ASC,腹水;IDC,浸润性导管癌。

更多的间充质外观。当CD24 +细胞中TGFBR2的表达缺乏时 (图4 C), 在这些细胞随后的TGFBR抑制剂处理中我们没有发现任何变化。有趣的是, 位于CD24 +癌细胞的β-连环蛋白、E-钙粘素是不正常的,这表明虽然这些细胞缺乏干细胞标记,但是他们不是正常分化的腔上皮

图5. CD24+,CD44+和PROCR+乳腺癌细胞间基因表达差异的临床相关性

(A) 有和没有标签“

A”的患者的肿瘤基因表达水平和远距离自由转移存活,这是由在CD44+和PROCR+癌症细胞SAGE库中对CD24+癌症细胞SAGE库表现为上调的基因组成。在每一个热图中,行代表对应基因标签“A”的微阵列探针而列代表来自以标签的平均表达值排序的数据集1,2,3的肿瘤。肿瘤患者平均表达值达到或超过75%的被称为“标签A+”;所有其他的被称为“标签A-”。底部的条表明在患者中存在(蓝色)或不存在(黑)远距离转移肿瘤。Kaplan-Meier曲线和对数等级测试p值表明, 在所有的三个数据集中“标签A+”患者比“标签A-”患者有统计上显著(p

(B) 有和没有标签“B”的患者的肿瘤基因表达水平和远距离自由转移存活,这

是由在CD24+癌症细胞SAGE库中对CD44+和PROCR+癌症细胞SAGE库表现为上调的基因组成。热图的行和列如上所述,除了对应基因标签“B”探针。肿瘤患者平均表达值达到或低于25%的被称为“标签B-”;所有其他的被称为“标签B+”。底部的条如上所述。Kaplan-Meier曲线和对数等级测试p值表明, 在所有的三个数据集中“标签B-”患者比“标签B+”患者有统计上显著(p

(C) CD44+细胞特异的“TGF-β盒” 高和低表达的患者的肿瘤基因表达水平和远距离自由转移存活,它由表1Ⅲ中的基因组成。热图的行代表对应“TGF-β盒”中的基因的微阵列探针,列代表来自由盒的平均表达值排序的数据集1的肿瘤。肿瘤患者的平均表达值达到或超过75%的被称为“TGF-β盒高”;而其他的称为“TGF-β盒低”。底部的条如上所述。Kaplan-Meier曲线和对数等级测试p值表明, “TGF-β盒式高“的患者比“TGF-β盒式低”的患者有统计上显著(p

细胞。在测试条件下,TGFBR抑制剂对CD44 +或 CD24 +细胞的增殖和存活没有明显的影响 (图4 F)。

对CD44 +和PROCR +或CD24 +癌细胞特异的基因签名的预计价值

为了确定CD44 +、 CD24 +和PROCR +乳腺癌细胞的基因表达图谱的临床意义,我们研究了在癌症PROCR +和CD44 + 细胞SAGE库与癌症CD24+细胞SAGE库相比上调或下调的基因在次级肿瘤中的表达是否与乳腺癌病人的临床结果相关。两组基因被发现与远的自由转移的存在于三个独立出版的关于未接受化疗或激素治疗的淋巴结阴性肿瘤患者的数据集在统计上是显著相关的。两个数据集作为选择可能与结果相关的基因的培养集 ,而第三个数据集仅是用来作为测试集。标签“A”和“B”分别组成与癌症CD24 +细胞相比在癌症CD44 +和PROCR+细胞中基因的上调和下调 (表2)。标“A” 的高表达基因是与短距离自由转移肿瘤的存活时间相关的基因,而标“B”的高表达基因的是与长距离自由转移肿瘤的存活时间相关的基因(图5A和5 B)。在第三个数据集,标“A”和“B”的分别是与更短和更长自由复发及

总生存时间相关的基因(补充数据)。标签既不是一贯的与肿瘤的雌激素受体(ER)状态或组织学分级有统计学显著相关性,也不是每个标签与患ER +,ERˉ,高级和低级肿瘤的患者的生存时间相关 (补充数据);因此, 标签“A”和“B” 的相关性结果是ER表达和肿瘤分级独立的。

自从我们的路径分析和TGFBR抑制剂处理实验暗示了在乳腺癌CD44 +细胞中TGF-β通路的激活可能对于它们的侵入性表型起重要的作用,我们还测试了在与三个数据集中的临床结果有关的“TGF-β盒” 的肿瘤中是否表达。“TGF-β盒”包括在癌症CD44 +和PROCR+细胞比癌症CD24 +细胞中有更多表达的15个基因 (表1Ⅲ)。在一个数据集中这些基因的高度表达与短距离自由转移肿瘤存活时间是统计上显著相关的 (图5 C),这表明TGF-β通路在肿瘤CD44 +细胞中的激活可能对在一个乳腺癌患者的细胞团中的疾病研究进展有重大作用,并且这些患者可能受益于针对这一途径的靶向治疗。

在正常组织和肿瘤组织中的CD44 +和 CD24 +细胞定位

因为CD44 + 和CD24 +细胞的隔离包括多个步骤, 一些基因的程序改变表达的可能性不能排除。为了通过使用完好的组织的方法验证SAGE数据并且确定CD44 +和 CD24 +细胞在正常乳腺组织和乳腺癌中的数量和位置,我们进行了基于SAGE的免疫组化分析为这两个细胞类群选择特异的基因 (图6A)。在正常的乳腺组织,细胞呈联接蛋白43(Cx43)、 PROCR和平滑肌肌动蛋白(SMA)阳性,定位于基底/肌上皮层。几乎所有的上皮(腔的和基底的)细胞呈CD44阳性,而在一些腔的上皮细胞能检测到弱的CD24染色。有趣的是,在孕妇的乳腺组织中,呈Cx43、CD44和PROCR阳性的细胞只在一些管道检测到,这表明这些基因的表达在减少或表达它们的细胞数在减少。

接下来,我们分析了不同时期的乳腺肿瘤,包括20个DCIS(原位乳腺管癌)和250个带有不同淋巴结和距离转移状态的主要侵入性肿瘤。我们观察到了CD24、CD44、Cx43、CK19,CK17,FN1和SMA的不同表达以及对它们呈阳性的细胞的不同分布 (图6B和未显示的数

图6. 正常乳腺组织和乳腺癌组织的免疫组化分析

(A) 使用指定基因的正常的和怀孕的乳腺组织的免疫组化分析的例子。所有的CD44+细胞标记(Cx43、CD44、PROCR和SMA) 在基底细胞呈阳性,且SMA在终端分化的肌上皮细胞也呈阳性。在怀孕的乳腺组织,细胞呈CD44,Cx43和PROCR阳性,这只局限在终端导管。比例尺:100μM。

(B) 使用抗指定基因的抗体在DCIS(原位导管癌)和乳腺浸润性导管癌中观察到的免疫组化染色模式的代表性的例子。Cx43、CD44、

CD24和SMA在上皮细胞中具有不同的表达和分布。SMA在DCIS肌上皮细胞和肌纤维中也呈阳性。比例尺:200μM。

(C)来自有CD44、CD24和SMA表达的指定的器官的初级乳腺肿瘤和相应的远距离转移肿瘤的免疫组化分析。初级肿瘤呈CD24阴性,但所有的远距离转移肿瘤呈强烈的CD24阳性。比例尺:200μM。

据)。一些肿瘤只包含CD44 + 或CD24 +细胞,而其他的则有两种细胞类型的混合或两种细胞类型全部缺乏。在一些DCIS中,我们观察到了专一地表达CD44和CD24的不同细胞亚群交替排列。CD24和CD44的表达与任何肿瘤的组织病理特征没有显著地统计学相关性。

为了确定CD44 + 或CD24 +细胞的数量在原发肿瘤与远距离转移肿瘤之间是否不同,我们分析了从多个独立患者获得的匹配的样本。在所有的八个患者的分析中,不管远距离转移肿瘤的位点(所有来自

固体器官如肝、肺、骨、肾上腺)在哪儿,其中CD24 +细胞的频率与原发肿瘤相比明显更高,而对CD44、SMA Cx43、CK19和CK17呈阳性的细胞数量没有显示与CD24 +细胞频率一致的差异(图6 C和未显示的数据)。

讨论:

肿瘤包含一个有干细胞特性的细胞亚群的假说引发了新的兴趣和兴奋,部分由于细胞群无效的靶位点引起治疗失败和复发的假设。不幸的是,关于乳腺 “癌症干细胞”的分子特性和临床作用的可利用数据非常有限。尽管发展的远处转移的肿瘤主要在骨)有较高的CD44 + / CD24ˉ细胞比例,但是通过免疫组织化学鉴定的公认的乳腺癌干细胞数量的分析未能鉴定CD44 + / CD24ˉ细胞的频率与临床行为之间有显著的关联。通过对来自一些不同肿瘤类型的大量的基因表达数据中的11-基因的BMI1驱动的干细胞基因标签预测意义的研究确定了这个标签是一个有力的短期的自发疾病和总生存率及远距离转移风险的预报器。

为了更好地了解乳腺癌癌细胞和来自正常乳腺组织中的类似的细胞中CD44 +和CD24+细胞的分子差异,我们确定了他们全部的基因表达和基因图谱。通过使用这种方法,我们得出了几个重要的结论。首先, CD44 +细胞的基因表达图谱类似于干细胞的基因表达图谱,并且正常的CD44 +细胞和肿瘤CD44 +细胞之间比与来自同一组织的CD24 +细胞更相似。其次,肿瘤CD44+和 CD24 +细胞具有同源相关性,但并不总是相同,因为在一些肿瘤CD24 +细胞中除了那些和CD44 +细胞共享的基因外有额外的基因改变。第三,不同的细胞基因表达图谱反映了不同的信号通路的激活,而且其中有些是乳腺癌CD44 +细胞特异的,这表明他们靶向治疗的方法。有趣的是, 参与细胞运动和血管生成的基因在CD44 +细胞中是高度表达的,而参与RNA剪接和碳水化合物代谢的基因在CD24 +细胞中是高度表达的。这是符合CD44 +细胞展示出的一个更间充质的能动的并且更少增生的干细胞状图谱的。第四, CD44+乳腺癌细胞是呈ER阴性的,甚至在一些ER+肿瘤(ER

表达于CD24+细胞)中也是如此。第五,乳腺癌CD44+ 和CD24+细胞基因表达标签与临床结果有关联。因为这些标签是使用大部分肿瘤的表达数据生成的,所以这个结果可能意味着肿瘤内癌症CD44+和 CD24+细胞的数量与临床结果是相关的。具体来说, 主要由CD44+细胞组成的肿瘤的临床行为可能比主要由CD24 +细胞组成的肿瘤更糟。标有“A”(乳腺癌CD44+细胞的特征)的许多基因参与细胞运动、入侵、凋亡和ECM重塑,而标有“B”(乳腺癌CD24+细胞的特征)的包含多个参与炎症和免疫功能的基因。

我们发现TGF-β信号通路在CD44 +乳腺癌细胞中特异激活,已知它在人类胚胎干细胞以及肿瘤发生中发挥重要作用。TGF-β在肿瘤进展中发挥双重作用:它是一种最强有力的细胞增殖抑制剂,但它促进肿瘤入侵,血管生成,上皮-间质转变(EMT)和转移。我们的结果表明, 具有不同表型的细胞即使在同一肿瘤和组织类型内, 对TGF-β的激活都有不同的反应。有趣的是,我们发现在肿瘤分析中CD44 +乳腺癌细胞中TGF-β信号通路的特异激活是由于TGFBR2受体在这些细胞中的限制性表达及其在CD24 +细胞中的表观遗传沉默。与此相关,经过TGFBR激酶抑制剂处理特异地影响CD44+肿瘤细胞,这导致了从间充质到上皮的转变。TGF-β信号通路基因的高度表达与一系列乳腺癌患者中较短距离的自由转移存活有关联,这进一步强调TGF-β信号通路在CD44 +乳腺癌细胞中的重要性。由于当前TGF-β途径抑制剂在临床试验中的检测,这些发现可能有直接的治疗意义。

因为我们的全基因表达图谱仅限于少数情况下,所以我们通过免疫组织化学方法在较多的正常乳腺组织和不同时期的乳腺癌中分析选择的基因的表达。这表明,细胞表达的CD44+细胞特异的基因

(CD44、Cx43和PROCR)被定位在正常乳腺组织导管和腺泡的基底细胞层,并且他们的数量会在怀孕后期大大减少。怀孕被认为导致乳腺上皮干细胞终端分化,并且早期足月妊娠降低了患某些乳腺癌的危险(绝经后的ER +肿瘤),这可能是因为减少了可以作为细胞转换目标的细胞的数量。我们的结果与此假设一致,尽管证明它将要求来自于有

不同等级和乳腺癌历史的女性的正常乳腺组织的分析。

肿瘤的免疫组织化学分析显示高度的样本中选择的基因的表达异质性。CD24和CD44在原发性乳腺浸润性癌中的表达(单独或联合分析)与任何肿瘤特征无关。在原发肿瘤中SMA的表达(在肿瘤细胞中)与淋巴结、远距离转移、ER和HER2状态有关,而Cx43的表达与ER状态相关联。令人惊讶的是,我们发现CD24 +细胞的数量在与原发性肿瘤和远距离转移肿瘤位置的类型无关的远距离转移肿瘤中持续显著增长。尽管这种观点看似与CD24+细胞代表分化的和很少致瘤的癌症细胞的假设矛盾,但它是符合CD24表达与肿瘤进展和转移性行为相关联的报告。对这个明显的矛盾有几种可能的解释。一个基因的表达可能不足以用来唯一地鉴定一个有特定表型的细胞。在实验系统中的致瘤性研究 (如,向免疫缺陷小鼠的乳腺脂肪垫中注射肿瘤细胞)可能反映不了病人体内细胞的行为。在转移过程中,肿瘤细胞可能会改变他们的表型和基因表达图谱。最后, 通过我们的FISH结果还证明了在肿瘤CD44+ 和CD24+细胞间的克隆遗传差异,CD44+ 和CD24+细胞可能经历了独立的克隆进化。

总之,我们对乳腺癌的CD44+和 CD24+细胞的综合的分子和表型分析显示他们代表具有不同的基因表达、表观遗传和遗传图谱定义的细胞群体。尽管CD44 +细胞似乎表达许多干细胞标记,但是同一肿瘤内CD24+和CD44+细胞间基因的差异提出了在乳腺癌中肿瘤干细胞假说的有效性,并且显示涉及肿瘤内异质性的克隆进化作为我们的数据和先前发表的数据的一种替代性解释。重要的是, 与CD24+和CD44+肿瘤细胞相关联的基因标签可能有临床相关性,并且CD44 +细胞中信号通路的特异激活可用于他们的靶向治疗。进一步的研究,特别是临床试验,是验证我们的发现以及确定靶向的CD44+肿瘤细胞是否会影响乳腺癌患者临床管理所必要的。

实验过程: 临床样本

新鲜的、冷冻的或福尔马林固定,石蜡包埋的肿瘤标本收集在哈佛大学附属

医院 (波士顿,MA)和约翰霍普金斯大学(Baltimore,MD)。所有的人类组织使用制度审查委员会批准的协议收集,通知从每个提供有链接的临床数据的组织个体得到同意。新鲜的组织样本立即作磁免疫的纯化处理,在补充数据中作详细描述。购自Imgenex(CA)的组织芯片是获取自合作的乳腺癌组织资源或在约翰霍普金斯大学生成的。

RT-PCR、SAGE、SNP阵列和qMSP分析

RT-PCR和SAGE分析正如前面描述的一样被基本地完成了。使用集群和标签完成了SAGE库的聚类,如表S7所列,结果是MapleTree可视化的。使用

Affymetrix 250 k阵列完成了SNP阵列分析,而且使用发表的方案对数据进行了分析。如前面所描述的,使用发表的引物完成了TGFBR2启动子甲基化分析。 荧光原位杂交

使用一个混合自BioNick标记工具的酶先对BAC探针

RP11-157-A11(1q21.3),RP11-812I22(17q21.2)和RP11-661N22(6 q21-q23.2) 进行地高辛标记。使用相同的标记工具对RP11-167M14(17q21.3-q22.1),

CTD-2349A18(8q24),RP11-606 C3(7p21.1)和RP11-697I2(17q11-q12)进行生物素标记。用秋水仙胺处理的CD24+,CD44+和PROCR+培养物的获得并根据标准方案用于中期染色体伸展准备。如前所述,进行了中期染色体的杂交。根据制造商的建议使用Cytocell技术有限公司提供的试剂对探针进行了检测。使用CytoVysion成像系统摄取照片。 功能注释、网络分析和基因表达的相关性结果

SAGE库中基因的高度代表是被基因本体论生物过程使用DAVID功能注释工具进行了功能性分类的 (http://david.abcc.ncifcrf.gov/summary.jsp)。通过网络分析,CD44+和CD24+细胞之间的基因差异表达被上传到MetaCore分析套件版本2.0,且分析结果如前面描述的。使用Cox比例的障碍回归,层次聚类, Kapian-Meier分析和对数等级测试鉴定了基因标签与结果的相关性。使用

Kapian-Meier分析和对数等级测试检测了TGF-β基因与临床结果的相关性。这些方法的详细描述包含在补充数据中。

初级细胞培养,FACS和免疫印迹分析

使用补充数据中详细描述的方案培养纯化的细胞。使用来自BD生物科学的

FITC-或PE-成对的CD24,CD44和PROCR抗体进行如前所述的FACS分析。使用来自于细胞信号的BCTN,phospho-SMAD2/3和SMAD2/3抗体进行免疫细胞化学和免疫印迹分析,CDH1来自BD生物科学,ZO1来自Chemicon,并且方案是供应商推荐的。分析之前用0.5毫摩尔最终浓度的LY2109761 TGFBR抑制剂处理细胞24小时。如前所述进行了基本的细胞周期分析。 免疫组织化学

如前所述进行了基本的免疫组织化学分析,使用的主要抗体如下:CD24、CD44、Cx43、PROCR、SMA、CK17和CK19。通过病理学家P.A.进行了强度为0-3(0 =没有染色,1 =微弱信号,2 =温和染色,3 =强烈染色)且程度为0-3(0 =不,1 70%的阳性细胞)规模的抗体染色打分。通过计分析,一个累积分数达到或超过2则被认为是阳性的。 补充数据

补充数据包括15张补充图片, 7个补充表格以及补充实验过程可与本文一起在以下网站找到:

http://www.cancercell.org/cgi/content/full/11/3/259/DC1/。

乳腺肿瘤异质性的分子定义

概要:

有明显包括干细胞状属性表型的细胞被提出存在于正常的人类乳腺上皮和乳腺癌,但他们的详细的分子特征和临床意义尚不清楚。我们通过使用优先与干细胞状属性相关联的标记确定了从癌细胞和正常乳腺组织中纯化出的细胞的基因表达和遗传图谱。来自不同个体肿瘤的CD24 +和CD44 +细胞是相关的同源细胞,但并不总是完全相同的。CD44 +细胞特异的基因包括许多已知的干细胞标志物基因及与降低病人存活率相关的基因。TGF-β通路是专门活跃在CD44 +癌细胞中的,其抑制剂诱导产生更上皮样的表型。我们的数据显示了CD44 +细胞和不同的肿瘤细胞群体治疗靶点的预后的相关性。 介绍:

虽然起源于正常细胞的肿瘤由于积累了遗传的和表观遗传学的改变,但是肿瘤起始细胞的身份很大程度上是未知的。干细胞已经被提议作为具有吸引力的目标,这是因为他们与癌细胞有很多相同的特征,包括自我更新的能力、产生异构的后代并且迁移侵入周围组织。与此相关联的, 正常干细胞功能所需的几个通路和基因在肿瘤细胞中被激活并且在肿瘤发生中发挥重要作用。癌症干细胞被定义为具有干细胞状属性的肿瘤细胞的一个子集, 干细胞状属性被认为是负责肿瘤生长、恶化、复发的。许多年前提出了这个假说且近年来通过新的实验方法得以复兴。通过频繁地使用细胞表面标记物特异的标记来自相同器官的正常干细胞,假定的癌症干细胞已被从各种人类的肿瘤类型中纯化出来了。通过在体外克隆性和体内致瘤性的研究中的演示,这些孤立的细胞的致瘤性和“干细胞特性”已经被证明了。

人类乳腺上皮细胞分化的阶段和独特的识别分化细胞和祖细胞的标记物是没有明确定义的。体外克隆性研究表明双极的祖细胞的存在能增加腔上皮和肌上皮细胞、谱系限制性腔上皮细胞和肌上皮细胞的祖细胞,以及分化的腔上皮和肌上皮细胞。MUC1和CD10(CALLA/ MME)被认为是分别由腔上皮细胞和肌上皮细胞表达的。CD44是出现在祖

细胞中,然而在正常人类乳腺中上皮细胞表达CD24尚未确定。在乳腺癌中,Al-Hajj等人证明了来自于乳腺癌患者的恶性胸腔积液的Linˉ/ CD44 + / CD24ˉ / CD24低(后来归类为CD44 +)细胞在NOD/SCID小鼠中比在CD44 / CD24 +(后来归类为CD24 +)细胞中具有更多的肿瘤发生,结果xenografts复制原始肿瘤的异质性, 从而产生CD44 +细胞是乳腺癌干细胞的假设。随后在乳腺癌和前列腺癌的研究中证实,CD44 +细胞是肿瘤发生细胞,当将其注入免疫缺陷小鼠时则产生祖细胞状的性状。所有这些研究都没有分析复杂的分子结构和临床CD44 +细胞和 CD24 +细胞的相关性或提供确凿的证据证明CD44 +肿瘤细胞是干细胞且CD24 +肿瘤细胞是他们的后代。此外,癌症干细胞和肿瘤恶化基因克隆发展的假设之间的关系也没有被研究。

为了着手解决这些问题,我们使用CD44和CD24从乳腺癌组织中纯化出了细胞并且确定了他们全部的基因表达和基因图谱。相比之下,我们也从正常人类乳腺上皮分离特化了CD44 + 和CD24 +细胞。CD44 +乳腺癌细胞特定的基因标签被优化为已知的干细胞标记物和相关的临床结果以及信号通路的活跃性,但癌症的CD44 + 和CD24 +细胞并不总是基因完全相同的。

结果: 净化和基因表达谱数据不同的乳腺上皮细胞群

我们使用在分化的细胞或具有干细胞性状的细胞中有特异表达的细胞表面标记纯化了正常乳腺上皮和乳腺癌细胞不同的细胞亚群 (图1A)。我们从来源于乳房缩小整形术和不同时期的乳腺肿瘤的正常人类乳腺组织中纯化出了CD44 + 和CD24 +细胞。基于最初的从胸膜积液和腹水样本纯化出的CD44 +细胞的基因表达图谱,我们发现了一个CD44 +细胞特异的基因(PROCR),它编码一个细胞表面受体,并且与同样表达在白细胞和肌纤维的CD44细胞相比更特异的表达于CD44 +上皮细胞。PROCR已被作为一种造血、毛囊、神经和胚胎干细胞的标记。在证实100%的CD44 +肿瘤细胞呈PROCR阳性后 (数据没有显示),我们使用这个标记从主要入侵的乳腺肿瘤中分离CD44 + / PROCR

+(后来归类为PROCR +)细胞 (参见在补充数据中可提供的这篇文章的在线数据中的图S1A)。在补充数据中提供了纯化过程和组织样品的详细描述。 图1. 不同细胞亚群的纯化和基因表达分析

(A)来自正常乳腺组织和侵入性转移性乳腺癌癌组织的各种细胞的纯化原理图解。使用对每个细胞类型特异的抗体耦合磁珠捕获细胞。有矩形框的纯化步骤并不总是包括在流程中,而标有星号的肌纤维只存在于侵入性肿瘤。IDC表示浸润性导管癌。分离于正常乳腺组织的纯化后的细胞片段的半定量PT-PCR分析 (N1)(B)胸腔积液(PE2)(C)主要浸润性导管癌(IDC28)(D) 来自于CD24+,CD44+和PROCR +细胞的RNA的已知分化(Diff)和干细胞特异基因的表达检测。CD44+和PROCR +细胞缺乏分化标记且呈干细胞标记物阳性。在主要的侵入性肿瘤,CD44 +片段被白细胞污染了,说明它有高水平的CD45白细胞共同抗原(PTPRC)的表达。ACTB作为上样对照。每个三角形表明一个PCR循环的增加(25、30、35)。(E) 来自CD44+、PROCR+和CD24 +细胞的SAGE库的系统树图描绘了其相关性。层次聚类应用于SAGE数据显示的库,并且聚类热图选定的部分显示在这里。每一行代表一个标签,并且用最佳匹配那个标签的基因符号标记 (或“不匹配”如果没

有发现匹配的记录)。红色和绿色分别显示高和低的表达水平。正常的和肿瘤的CD44+和PROCR+细胞的表达图谱之间比那些来自同一个组织的CD24+细胞更相似。ASC,腹水;PE,胸腔积液;N,正常;IDC,浸润性导管癌。(F)基因本体生物过程类别高度代表了来自不同的细胞类群的SAGE库。至少在一个库中,使用DAVID功能注释工具绘制的类别的富集得分> 2。细胞类群代表包括癌症CD44+和PROCR+(红色),正常的CD44+和PROCR+(粉色)、癌症CD24+(深蓝色)和正常的CD24+(浅蓝色)细胞。

我们使用白细胞,管腔上皮细胞,肌上皮细胞和干细胞标记物通过半定量的RT-PCR证实了纯化和分化状态的细胞分数 (图1B-1D和图S1B)。已知的腔上皮细胞和干细胞的标记分别在CD44 +和 CD24 +细胞中有接近互斥地专一的表达,这表明他们可能的确分别代表腔上皮和祖细胞状的细胞。正常乳腺组织和乳腺癌组织的CD44+细胞中都存在低丰度的雌激素受体α(ESR1),意味着这些细胞对雌激素没有反应(图1B-1D和表1Ⅱ)。在正常CD44 +细胞中雌激素和孕激素受体以及ERBB2的缺乏进一步证明这些细胞可能代表祖细胞,因为鼠乳腺上皮干细胞不表达这些蛋白质。我们还分析了包括BMI1和刺猬(Hh)-信号通路基因在内的与自我更新相关的基因的表达。Gli2 和Gli1在CD44 + 细胞中比在CD24 +细胞中表达量更多,这反映了(Hh)信号的活性,而BMI1在两种细胞中的表达本质上是相同的 (图S1C和S1D)。

为了确定纯化细胞全面的基因表达图谱,我们从纯化于从乳腺癌患者体内收集的正常乳腺上皮细胞和胸腔积液、腹水以及原发性浸润性肿瘤样本的CD44 + 和CD24 +细胞中生成了SAGE(基因表达的系列分析)库 (具体描述见补充数据)。我们给每个SAGE库分配了一个基于样本和用于纯化细胞的细胞表面标记的名称。SAGE数据进一步支持了假设CD44 + 和CD24 +细胞分别代表更多分化的腔上皮和祖细胞状细胞,因为在各自的SAGE库发现已知的这些细胞的标记几乎是相互专一的 (表1i和1ii和表s1-s6)。SAGE库在无监督下的层次聚类证明正常的和癌症的CD44 +和PROCR +细胞之间要比同来自同一组织

的CD24 +细胞更相似 (图1 E)。在各种SAGE库中基因功能的分类表 表1.选择的基因在CD44+或PROCR+ 和CD24+细胞之间的差异表达

匹配的SAGE标签序列, 在每个指明的SAGE库中计算每200000个标签,并且列出了基因符号和为基因编码已知的干细胞(Ⅰ)或分化(II)细胞标记物或TGF-β通路组件和目标物(III) 的描述。N,正常;PE,胸腔积液;ASC,腹水;IDC,浸润性导管癌。 达揭示癌症的和正常的

CD44 +和PROCR+细胞含有更丰富的参与细胞运动、趋化性、止血、血管生成的基因,而CD24 +细胞更多的高度表达的基因与碳水化合物代谢和RNA剪接有关(图1 F)。

在CD44 +和 CD24 +乳腺癌细胞中基因的改变

为了确定个体肿瘤内CD44 + 和CD24 +细胞的克隆关系,对从这些细胞分离出的基因组DNA进行了SNP序列分析。结果数据显示,在

图2. 不同的肿瘤细胞亚群遗传图谱分析

(A) 对来自同一患者的存在于分离于胸腔积液(PE2和

PE6)和浸润性导管癌(IDC31)的CD44+ CD24+和PROCR+细胞中的正常白细胞的拷贝数量相对改变的SNP阵列分析。PROCR+*细胞是经CD44抗体进一步选择后的PROCR+细胞。红色和蓝色分别表明拷贝数量的增加和减少。来自每个肿瘤的一对不同的细胞类群总体似乎有相同的拷贝数变化。Chr,染色体。

(B) 分别使用具有成对的FITC和PE的抗CD24和抗CD44抗体对初级培养的胸腔积液(pcPE)CD44+和CD24+细胞进行的FACS分析。在CD44+和 CD24+细胞中CD44和CD24是相互排斥表达的。

(C) 使用BAC RP11-157A11标记到1q21.3(绿色)和BACCTD-2349A18标记到8q24.3(红色)对来自初级培养的胸腔积液(pcPE)CD44+和CD24+细胞的中期染色体和间期核进行的FISH分析。有8q24.3特异探针的FISH显示在所有三个细胞

片段中一个在这个位点重排的杂交模式特点(两个更亮,更大的和两个更弱,更小的信号)。有1q21.3特异探针的FISH显示在中期染色体和间期核中有多个信号(4-7),特征是来自染色体1长臂(q)的染色体物质的获得。

(D) 使用BAC RP11-157A11标记到1q21.3和1号染色体着丝粒(cen)探针(D1Z5)对未培养的胸腔积液(PE)CD24 +细胞进行的FISH分析。有代表性的间期核显示有多个对1q21.3位点(绿色)特异的杂交信号以及三个和四个对着丝粒区(红色)特异的杂交信号,这符合染色体1物质的增加。

一些肿瘤中两种细胞片段有相同拷贝数的改变,似乎他们是基因完全相同的(图2A)。为了分析CD44 + 和CD24 +细胞在单细胞水平下的基因组成,我们提出了一个供他们短期体外培养的方案, 就是根据细胞表面和细胞类型特异的标记的分析来维持他们的表型 (图2B和4C)。这些初级的培养被用于中期FISH分析,该分析使用BAC探查相应的染色体区域,这些区域在乳腺癌中经常被放大并且包含肿瘤

CD44 +或CD24 +细胞中特异地高表达的基因。这个分析确定了基因改造对于所有的细胞片段(8q24.3重排)来说是常见的,并且发现了仅在CD24 +细胞中有的一个基因改造(1q21.3增加)(图2C)。在所有CD24 +细胞中都能发现这种独特的基因变化, 并且这样的变化也存在于原始肿瘤中 (图2D)。因此,我们确定个体肿瘤内的CD44 + 和CD24 +细胞是具有相关同源性的,但CD24 +细胞可以有额外的不出现在CD44 +细胞的基因变化。

活跃于CD44 +细胞中的信号通路

为了识别基于我们SAGE数据的在CD24 +或CD44 +细胞中具有特异活性的信号通路,我们利用了最近应用于高通量数据的功能分析的MetaCore数据挖掘技术。首先,我们排列了基因实体的功能过程和规范的途径,根据统计显著适合于与相应的CD24+细胞SAGE库相比在正常或癌症CD44 + 细胞SAGE库中含量最高的基因的表达 (图S2A和S2B及未显示的数据)。在基因实体功能过程中,细胞运动、细胞粘附、蛋白质的生物合成、蛋白质折叠和细胞增殖强烈地适应正常CD44 +细胞中的基因上调以及癌症CD44 +细胞中的基因上调。细胞

运动和细胞粘附在此分析中有高的色散分数,这表明每个过程中不同的基因在癌症和正常CD44 +细胞中是上调的。在典型的途径中,TGF-β和WNT信号、细胞骨架重塑,整合素介导的过程, ephrin B反向信号以及趋化因子和细胞粘附强烈地适应正常CD44 +细胞中的基因上调以及癌症CD44 +细胞中的基因上调。图S3和S4描述了参与TGF-β和WNT信号、细胞骨架重塑以及更详细的TGF-β通路的基因。 图3. 在癌症CD44+细胞中TGF-β信号通路的调节网络

在癌症和不正常的CD44 +细胞与相应的CD24 +细胞相比以TGF-β为中心的直接交互网络基因上调。线的颜色显示抑制(红色),激活(绿色)及没有明确的关系(灰色)。

我们也使用了MetaCore数据挖掘技术对CD44 +和 CD24 +细胞中通过在表达基因间建立直接的交互(DI)网络来差异调节的途径进行更详细的分析,这些基因在正常或癌症CD44 +细胞SAGE库中的表

达量比相应的CD24 +细胞SAGE库多。在癌症CD44 +细胞特异的基因间DI网络的建立是以TGF-β1为中心的(图3和图S5)。TGF-β1中的发动蛋白、纤连蛋白、小窝蛋白及酪蛋白激酶Ⅱ组分仅仅在癌症

CD44 +细胞中是上调的,而胶原蛋白1和转录因子HIF1A和ETS1组分在癌症和正常的CD44 +细胞中都是上调的(图S6和S7)。正常CD44 +细胞特异的基因间建立的DI网络是以VEGF-A、IL-1、NF-kβ、AP-1、Rac1、SMAD3、功能激活的Notch通路和TGF-β3为中心的(图S8、S10和S13)。癌症CD44 +细胞特异基因的DI网络的一个亚网络以包含乳腺癌相关基因在内的TGF-β1为中心,如图S9所示,以及来自于个体癌症样本的CD44 +细胞的上调表达基因的附加网络的建立如图S11、 S12、S14和S15所示。

乳腺癌CD44 +细胞中的TGF-β通路

由于已知的TGF-β信号通路在调节人类胚胎干细胞的多能性中的重要性;它在分化、肿瘤发生、转移中的作用;以及我们的SAGE(表1Ⅲ)和MetaCore数据暗示这条通路在CD44 +细胞中,所以我们进一步详细地调查了它在乳腺癌CD44 +细胞中的作用。我们在CD44+和CD24 +细胞中通过半定量RT-PCR分析了参与TGF-β信号通路的选择基因的表达 (图4A)。与我们的SAGE和MetaCore数据相关, TGF-β1在肿瘤CD44 +细胞中与TGFBR2一起几乎完全表达, TGFBR2是TGF-β所需的一个信号受体 (图4A)。在肿瘤CD44 +和 CD24+细胞之间的引人注目的TGFBR2 mRNA水平的差异显示这个基因潜在的加强表观遗传调控。染色质修饰和启动子甲基化被描述为导致一些肿瘤中

TGFBR2沉默的潜在的机制。我们分析了肿瘤CD44 + 和CD24 +细胞中TGFBR2的DNA甲基化状态并且确定在CD24 +细胞中TGFBR2是高甲基化的,这就潜在的解释了TGFBR2在这些细胞中表达缺乏的原因(图4 B)。这个结果也表明,肿瘤CD44 +和 CD24 +细胞是表观遗传学截然不同的, 更多广泛的分析证实了这个发现。

为了测试在癌症CD44 +细胞中TGF-β信号通路活性的功能相关性,我们研究了双重TGFBR1 / TGFBR2激酶抑制剂(LY2109761)对体外培养的CD44 + 和CD24 +细胞生长分化的影响。首先,我们证实了TGF-β通路的组件和细胞类型特异的基因的表达在初级培养时是相同的,就如新鲜的不受TGFBR抑制剂治疗影响的肿瘤样本一样(图4

图4. 在肿瘤CD44+和CD24 +细胞中的TGF-β通路

(A) 参与分离于胸腔积液

(PE2)和腹水(ASC3)的CD44+和CD24+细胞中的TGF-β信号通路的基因的表达的半定量RT-PCR分析。TGFB1和TGFBR2在CD44 +细胞中是超表达的。GAPDH是用作上样对照。每个三角形表明PCR循环数越来越多(25、30、35)。

(B) 在来自初级培养的胸腔积液(pcPE)或新鲜的分离于浸润性导管癌(IDC)肿瘤样本的CD24 +(白色条)和CD44 +(黑色条)细胞的TGFBR2启动子的定量的

甲基化特异的PCR(qMSP)分析。

(C) 参与初级培养的胸腔积液(pcPE) CD44 + 和CD24 +细胞中TGF-β信号通路和干细胞功能的基因的表达的半定量RT-PCR分析。TGFBR2,GJA1和PROCR仅发现于CD44 +细胞,而SMAD2和 TGFBR1的表达在两个细胞群中是相同的。ACTB作为上样对照。每个三角形表明PCR循环数越来越多 (25、30、35),用颜色指示细胞培养中缺乏(白色)或存在(黑)TGFBR抑制剂。

(D) TGF-β和TGFBR抑制剂存在与缺乏的条件下,初级培养的胸腔积液(pcPE) CD44+和CD24+细胞的SMAD2/3和phospho-SMAD2/3蛋白质含量的免疫印迹分析。

(E) 用TGFBR抑制剂处理前后的初级培养的胸腔积液(pcPE)CD44+和CD24+细胞中的β-连环蛋白,E-钙粘素和ZO-1的表达和细胞定位的相差(PC)图像和免疫荧光分析。随着抑制剂的处理,CD44 +细胞经历了显著的形态学改变和β-连环蛋白,E-钙粘素和ZO-1在细胞膜的重新分配,而CD24+细胞显示没有响应。

(F) TGFBR抑制剂处理前(黑线)和处理后(红色线)的初级培养的胸腔积液(pcPE) CD44 +和 CD24 +细胞的细胞周期图谱。抑制剂对每一细胞类型的增殖没有影响。

C)。我们也证实, TGF-β信号通路只是在CD44 +细胞作为对TGF-β处理的响应而被激活,并且这个通路受到SMAD2/3的磷酸化决定的TGFBR抑制剂的抑制(图4 D)。CD24 +细胞表现出高的基本的

phopho-SMAD2/3水平,这可能是由于激活素信号的作用或TGFBR1存在突变。紧接着,我们分析了是否TGFBR抑制剂处理影响了CD44 + 和CD24 +细胞的表型或增殖。这种处理导致CD44+细胞在24小时内产生了引人注目的形态学变化 (图4 E)。TGFBR抑制剂处理过的CD44 +细胞在外观更呈现出上皮状,而未经处理的CD44 +细胞则呈圆形和分散状(图4 E)。为了确定这种形态学变化是否是抑制剂诱导的上皮状分化的结果,我们通过免疫荧光法分析了β-连环蛋白、E-钙粘素和ZO-1(图4 E)。TGFBR抑制剂处理导致这三种蛋白质在细胞膜上的定位符合上皮细胞在此诱导下的表型。这些结果证明TGF-β途径在

CD44 +乳腺癌细胞中被特异激活,并且它至少在某种程度上调节他们

表2. 有预计价值的CD44+和PROCR +或CD24 +癌细胞特异的基因标签

匹配的SAGE标签序列, 在每个指明的SAGE库计算每200000标签,并且为标签“A”和“B的基因列出了基因符号和描述。与癌症CD24 +细胞SAGE库相比所有癌症CD44 +和PROCR +细胞SAGE库的这些基因分别是统计上显著上调和下调的。

N,正常;PE,胸腔积液;ASC,腹水;IDC,浸润性导管癌。

更多的间充质外观。当CD24 +细胞中TGFBR2的表达缺乏时 (图4 C), 在这些细胞随后的TGFBR抑制剂处理中我们没有发现任何变化。有趣的是, 位于CD24 +癌细胞的β-连环蛋白、E-钙粘素是不正常的,这表明虽然这些细胞缺乏干细胞标记,但是他们不是正常分化的腔上皮

图5. CD24+,CD44+和PROCR+乳腺癌细胞间基因表达差异的临床相关性

(A) 有和没有标签“

A”的患者的肿瘤基因表达水平和远距离自由转移存活,这是由在CD44+和PROCR+癌症细胞SAGE库中对CD24+癌症细胞SAGE库表现为上调的基因组成。在每一个热图中,行代表对应基因标签“A”的微阵列探针而列代表来自以标签的平均表达值排序的数据集1,2,3的肿瘤。肿瘤患者平均表达值达到或超过75%的被称为“标签A+”;所有其他的被称为“标签A-”。底部的条表明在患者中存在(蓝色)或不存在(黑)远距离转移肿瘤。Kaplan-Meier曲线和对数等级测试p值表明, 在所有的三个数据集中“标签A+”患者比“标签A-”患者有统计上显著(p

(B) 有和没有标签“B”的患者的肿瘤基因表达水平和远距离自由转移存活,这

是由在CD24+癌症细胞SAGE库中对CD44+和PROCR+癌症细胞SAGE库表现为上调的基因组成。热图的行和列如上所述,除了对应基因标签“B”探针。肿瘤患者平均表达值达到或低于25%的被称为“标签B-”;所有其他的被称为“标签B+”。底部的条如上所述。Kaplan-Meier曲线和对数等级测试p值表明, 在所有的三个数据集中“标签B-”患者比“标签B+”患者有统计上显著(p

(C) CD44+细胞特异的“TGF-β盒” 高和低表达的患者的肿瘤基因表达水平和远距离自由转移存活,它由表1Ⅲ中的基因组成。热图的行代表对应“TGF-β盒”中的基因的微阵列探针,列代表来自由盒的平均表达值排序的数据集1的肿瘤。肿瘤患者的平均表达值达到或超过75%的被称为“TGF-β盒高”;而其他的称为“TGF-β盒低”。底部的条如上所述。Kaplan-Meier曲线和对数等级测试p值表明, “TGF-β盒式高“的患者比“TGF-β盒式低”的患者有统计上显著(p

细胞。在测试条件下,TGFBR抑制剂对CD44 +或 CD24 +细胞的增殖和存活没有明显的影响 (图4 F)。

对CD44 +和PROCR +或CD24 +癌细胞特异的基因签名的预计价值

为了确定CD44 +、 CD24 +和PROCR +乳腺癌细胞的基因表达图谱的临床意义,我们研究了在癌症PROCR +和CD44 + 细胞SAGE库与癌症CD24+细胞SAGE库相比上调或下调的基因在次级肿瘤中的表达是否与乳腺癌病人的临床结果相关。两组基因被发现与远的自由转移的存在于三个独立出版的关于未接受化疗或激素治疗的淋巴结阴性肿瘤患者的数据集在统计上是显著相关的。两个数据集作为选择可能与结果相关的基因的培养集 ,而第三个数据集仅是用来作为测试集。标签“A”和“B”分别组成与癌症CD24 +细胞相比在癌症CD44 +和PROCR+细胞中基因的上调和下调 (表2)。标“A” 的高表达基因是与短距离自由转移肿瘤的存活时间相关的基因,而标“B”的高表达基因的是与长距离自由转移肿瘤的存活时间相关的基因(图5A和5 B)。在第三个数据集,标“A”和“B”的分别是与更短和更长自由复发及

总生存时间相关的基因(补充数据)。标签既不是一贯的与肿瘤的雌激素受体(ER)状态或组织学分级有统计学显著相关性,也不是每个标签与患ER +,ERˉ,高级和低级肿瘤的患者的生存时间相关 (补充数据);因此, 标签“A”和“B” 的相关性结果是ER表达和肿瘤分级独立的。

自从我们的路径分析和TGFBR抑制剂处理实验暗示了在乳腺癌CD44 +细胞中TGF-β通路的激活可能对于它们的侵入性表型起重要的作用,我们还测试了在与三个数据集中的临床结果有关的“TGF-β盒” 的肿瘤中是否表达。“TGF-β盒”包括在癌症CD44 +和PROCR+细胞比癌症CD24 +细胞中有更多表达的15个基因 (表1Ⅲ)。在一个数据集中这些基因的高度表达与短距离自由转移肿瘤存活时间是统计上显著相关的 (图5 C),这表明TGF-β通路在肿瘤CD44 +细胞中的激活可能对在一个乳腺癌患者的细胞团中的疾病研究进展有重大作用,并且这些患者可能受益于针对这一途径的靶向治疗。

在正常组织和肿瘤组织中的CD44 +和 CD24 +细胞定位

因为CD44 + 和CD24 +细胞的隔离包括多个步骤, 一些基因的程序改变表达的可能性不能排除。为了通过使用完好的组织的方法验证SAGE数据并且确定CD44 +和 CD24 +细胞在正常乳腺组织和乳腺癌中的数量和位置,我们进行了基于SAGE的免疫组化分析为这两个细胞类群选择特异的基因 (图6A)。在正常的乳腺组织,细胞呈联接蛋白43(Cx43)、 PROCR和平滑肌肌动蛋白(SMA)阳性,定位于基底/肌上皮层。几乎所有的上皮(腔的和基底的)细胞呈CD44阳性,而在一些腔的上皮细胞能检测到弱的CD24染色。有趣的是,在孕妇的乳腺组织中,呈Cx43、CD44和PROCR阳性的细胞只在一些管道检测到,这表明这些基因的表达在减少或表达它们的细胞数在减少。

接下来,我们分析了不同时期的乳腺肿瘤,包括20个DCIS(原位乳腺管癌)和250个带有不同淋巴结和距离转移状态的主要侵入性肿瘤。我们观察到了CD24、CD44、Cx43、CK19,CK17,FN1和SMA的不同表达以及对它们呈阳性的细胞的不同分布 (图6B和未显示的数

图6. 正常乳腺组织和乳腺癌组织的免疫组化分析

(A) 使用指定基因的正常的和怀孕的乳腺组织的免疫组化分析的例子。所有的CD44+细胞标记(Cx43、CD44、PROCR和SMA) 在基底细胞呈阳性,且SMA在终端分化的肌上皮细胞也呈阳性。在怀孕的乳腺组织,细胞呈CD44,Cx43和PROCR阳性,这只局限在终端导管。比例尺:100μM。

(B) 使用抗指定基因的抗体在DCIS(原位导管癌)和乳腺浸润性导管癌中观察到的免疫组化染色模式的代表性的例子。Cx43、CD44、

CD24和SMA在上皮细胞中具有不同的表达和分布。SMA在DCIS肌上皮细胞和肌纤维中也呈阳性。比例尺:200μM。

(C)来自有CD44、CD24和SMA表达的指定的器官的初级乳腺肿瘤和相应的远距离转移肿瘤的免疫组化分析。初级肿瘤呈CD24阴性,但所有的远距离转移肿瘤呈强烈的CD24阳性。比例尺:200μM。

据)。一些肿瘤只包含CD44 + 或CD24 +细胞,而其他的则有两种细胞类型的混合或两种细胞类型全部缺乏。在一些DCIS中,我们观察到了专一地表达CD44和CD24的不同细胞亚群交替排列。CD24和CD44的表达与任何肿瘤的组织病理特征没有显著地统计学相关性。

为了确定CD44 + 或CD24 +细胞的数量在原发肿瘤与远距离转移肿瘤之间是否不同,我们分析了从多个独立患者获得的匹配的样本。在所有的八个患者的分析中,不管远距离转移肿瘤的位点(所有来自

固体器官如肝、肺、骨、肾上腺)在哪儿,其中CD24 +细胞的频率与原发肿瘤相比明显更高,而对CD44、SMA Cx43、CK19和CK17呈阳性的细胞数量没有显示与CD24 +细胞频率一致的差异(图6 C和未显示的数据)。

讨论:

肿瘤包含一个有干细胞特性的细胞亚群的假说引发了新的兴趣和兴奋,部分由于细胞群无效的靶位点引起治疗失败和复发的假设。不幸的是,关于乳腺 “癌症干细胞”的分子特性和临床作用的可利用数据非常有限。尽管发展的远处转移的肿瘤主要在骨)有较高的CD44 + / CD24ˉ细胞比例,但是通过免疫组织化学鉴定的公认的乳腺癌干细胞数量的分析未能鉴定CD44 + / CD24ˉ细胞的频率与临床行为之间有显著的关联。通过对来自一些不同肿瘤类型的大量的基因表达数据中的11-基因的BMI1驱动的干细胞基因标签预测意义的研究确定了这个标签是一个有力的短期的自发疾病和总生存率及远距离转移风险的预报器。

为了更好地了解乳腺癌癌细胞和来自正常乳腺组织中的类似的细胞中CD44 +和CD24+细胞的分子差异,我们确定了他们全部的基因表达和基因图谱。通过使用这种方法,我们得出了几个重要的结论。首先, CD44 +细胞的基因表达图谱类似于干细胞的基因表达图谱,并且正常的CD44 +细胞和肿瘤CD44 +细胞之间比与来自同一组织的CD24 +细胞更相似。其次,肿瘤CD44+和 CD24 +细胞具有同源相关性,但并不总是相同,因为在一些肿瘤CD24 +细胞中除了那些和CD44 +细胞共享的基因外有额外的基因改变。第三,不同的细胞基因表达图谱反映了不同的信号通路的激活,而且其中有些是乳腺癌CD44 +细胞特异的,这表明他们靶向治疗的方法。有趣的是, 参与细胞运动和血管生成的基因在CD44 +细胞中是高度表达的,而参与RNA剪接和碳水化合物代谢的基因在CD24 +细胞中是高度表达的。这是符合CD44 +细胞展示出的一个更间充质的能动的并且更少增生的干细胞状图谱的。第四, CD44+乳腺癌细胞是呈ER阴性的,甚至在一些ER+肿瘤(ER

表达于CD24+细胞)中也是如此。第五,乳腺癌CD44+ 和CD24+细胞基因表达标签与临床结果有关联。因为这些标签是使用大部分肿瘤的表达数据生成的,所以这个结果可能意味着肿瘤内癌症CD44+和 CD24+细胞的数量与临床结果是相关的。具体来说, 主要由CD44+细胞组成的肿瘤的临床行为可能比主要由CD24 +细胞组成的肿瘤更糟。标有“A”(乳腺癌CD44+细胞的特征)的许多基因参与细胞运动、入侵、凋亡和ECM重塑,而标有“B”(乳腺癌CD24+细胞的特征)的包含多个参与炎症和免疫功能的基因。

我们发现TGF-β信号通路在CD44 +乳腺癌细胞中特异激活,已知它在人类胚胎干细胞以及肿瘤发生中发挥重要作用。TGF-β在肿瘤进展中发挥双重作用:它是一种最强有力的细胞增殖抑制剂,但它促进肿瘤入侵,血管生成,上皮-间质转变(EMT)和转移。我们的结果表明, 具有不同表型的细胞即使在同一肿瘤和组织类型内, 对TGF-β的激活都有不同的反应。有趣的是,我们发现在肿瘤分析中CD44 +乳腺癌细胞中TGF-β信号通路的特异激活是由于TGFBR2受体在这些细胞中的限制性表达及其在CD24 +细胞中的表观遗传沉默。与此相关,经过TGFBR激酶抑制剂处理特异地影响CD44+肿瘤细胞,这导致了从间充质到上皮的转变。TGF-β信号通路基因的高度表达与一系列乳腺癌患者中较短距离的自由转移存活有关联,这进一步强调TGF-β信号通路在CD44 +乳腺癌细胞中的重要性。由于当前TGF-β途径抑制剂在临床试验中的检测,这些发现可能有直接的治疗意义。

因为我们的全基因表达图谱仅限于少数情况下,所以我们通过免疫组织化学方法在较多的正常乳腺组织和不同时期的乳腺癌中分析选择的基因的表达。这表明,细胞表达的CD44+细胞特异的基因

(CD44、Cx43和PROCR)被定位在正常乳腺组织导管和腺泡的基底细胞层,并且他们的数量会在怀孕后期大大减少。怀孕被认为导致乳腺上皮干细胞终端分化,并且早期足月妊娠降低了患某些乳腺癌的危险(绝经后的ER +肿瘤),这可能是因为减少了可以作为细胞转换目标的细胞的数量。我们的结果与此假设一致,尽管证明它将要求来自于有

不同等级和乳腺癌历史的女性的正常乳腺组织的分析。

肿瘤的免疫组织化学分析显示高度的样本中选择的基因的表达异质性。CD24和CD44在原发性乳腺浸润性癌中的表达(单独或联合分析)与任何肿瘤特征无关。在原发肿瘤中SMA的表达(在肿瘤细胞中)与淋巴结、远距离转移、ER和HER2状态有关,而Cx43的表达与ER状态相关联。令人惊讶的是,我们发现CD24 +细胞的数量在与原发性肿瘤和远距离转移肿瘤位置的类型无关的远距离转移肿瘤中持续显著增长。尽管这种观点看似与CD24+细胞代表分化的和很少致瘤的癌症细胞的假设矛盾,但它是符合CD24表达与肿瘤进展和转移性行为相关联的报告。对这个明显的矛盾有几种可能的解释。一个基因的表达可能不足以用来唯一地鉴定一个有特定表型的细胞。在实验系统中的致瘤性研究 (如,向免疫缺陷小鼠的乳腺脂肪垫中注射肿瘤细胞)可能反映不了病人体内细胞的行为。在转移过程中,肿瘤细胞可能会改变他们的表型和基因表达图谱。最后, 通过我们的FISH结果还证明了在肿瘤CD44+ 和CD24+细胞间的克隆遗传差异,CD44+ 和CD24+细胞可能经历了独立的克隆进化。

总之,我们对乳腺癌的CD44+和 CD24+细胞的综合的分子和表型分析显示他们代表具有不同的基因表达、表观遗传和遗传图谱定义的细胞群体。尽管CD44 +细胞似乎表达许多干细胞标记,但是同一肿瘤内CD24+和CD44+细胞间基因的差异提出了在乳腺癌中肿瘤干细胞假说的有效性,并且显示涉及肿瘤内异质性的克隆进化作为我们的数据和先前发表的数据的一种替代性解释。重要的是, 与CD24+和CD44+肿瘤细胞相关联的基因标签可能有临床相关性,并且CD44 +细胞中信号通路的特异激活可用于他们的靶向治疗。进一步的研究,特别是临床试验,是验证我们的发现以及确定靶向的CD44+肿瘤细胞是否会影响乳腺癌患者临床管理所必要的。

实验过程: 临床样本

新鲜的、冷冻的或福尔马林固定,石蜡包埋的肿瘤标本收集在哈佛大学附属

医院 (波士顿,MA)和约翰霍普金斯大学(Baltimore,MD)。所有的人类组织使用制度审查委员会批准的协议收集,通知从每个提供有链接的临床数据的组织个体得到同意。新鲜的组织样本立即作磁免疫的纯化处理,在补充数据中作详细描述。购自Imgenex(CA)的组织芯片是获取自合作的乳腺癌组织资源或在约翰霍普金斯大学生成的。

RT-PCR、SAGE、SNP阵列和qMSP分析

RT-PCR和SAGE分析正如前面描述的一样被基本地完成了。使用集群和标签完成了SAGE库的聚类,如表S7所列,结果是MapleTree可视化的。使用

Affymetrix 250 k阵列完成了SNP阵列分析,而且使用发表的方案对数据进行了分析。如前面所描述的,使用发表的引物完成了TGFBR2启动子甲基化分析。 荧光原位杂交

使用一个混合自BioNick标记工具的酶先对BAC探针

RP11-157-A11(1q21.3),RP11-812I22(17q21.2)和RP11-661N22(6 q21-q23.2) 进行地高辛标记。使用相同的标记工具对RP11-167M14(17q21.3-q22.1),

CTD-2349A18(8q24),RP11-606 C3(7p21.1)和RP11-697I2(17q11-q12)进行生物素标记。用秋水仙胺处理的CD24+,CD44+和PROCR+培养物的获得并根据标准方案用于中期染色体伸展准备。如前所述,进行了中期染色体的杂交。根据制造商的建议使用Cytocell技术有限公司提供的试剂对探针进行了检测。使用CytoVysion成像系统摄取照片。 功能注释、网络分析和基因表达的相关性结果

SAGE库中基因的高度代表是被基因本体论生物过程使用DAVID功能注释工具进行了功能性分类的 (http://david.abcc.ncifcrf.gov/summary.jsp)。通过网络分析,CD44+和CD24+细胞之间的基因差异表达被上传到MetaCore分析套件版本2.0,且分析结果如前面描述的。使用Cox比例的障碍回归,层次聚类, Kapian-Meier分析和对数等级测试鉴定了基因标签与结果的相关性。使用

Kapian-Meier分析和对数等级测试检测了TGF-β基因与临床结果的相关性。这些方法的详细描述包含在补充数据中。

初级细胞培养,FACS和免疫印迹分析

使用补充数据中详细描述的方案培养纯化的细胞。使用来自BD生物科学的

FITC-或PE-成对的CD24,CD44和PROCR抗体进行如前所述的FACS分析。使用来自于细胞信号的BCTN,phospho-SMAD2/3和SMAD2/3抗体进行免疫细胞化学和免疫印迹分析,CDH1来自BD生物科学,ZO1来自Chemicon,并且方案是供应商推荐的。分析之前用0.5毫摩尔最终浓度的LY2109761 TGFBR抑制剂处理细胞24小时。如前所述进行了基本的细胞周期分析。 免疫组织化学

如前所述进行了基本的免疫组织化学分析,使用的主要抗体如下:CD24、CD44、Cx43、PROCR、SMA、CK17和CK19。通过病理学家P.A.进行了强度为0-3(0 =没有染色,1 =微弱信号,2 =温和染色,3 =强烈染色)且程度为0-3(0 =不,1 70%的阳性细胞)规模的抗体染色打分。通过计分析,一个累积分数达到或超过2则被认为是阳性的。 补充数据

补充数据包括15张补充图片, 7个补充表格以及补充实验过程可与本文一起在以下网站找到:

http://www.cancercell.org/cgi/content/full/11/3/259/DC1/。


相关内容

  • 乳腺癌分子分型与治疗策略_赵毅
  • ·704· 文章编号:1005-2208(2015)07-0704-05DOI:10.7504/CJPS.ISSN1005-2208.2015.07.04 目前,乳腺癌已成为威胁女性身心健康的常见肿瘤,其在分子水平上表现出的高度异质性越来越受到关注.乳腺癌的分子分型已被越来越多的临床医生作为指导乳腺 ...

  • 弥散加权成像研究进展
  • 摘要 随着MR技术的发展,DWI相关的研究越来越成为研究热点,如单指数.双指数.拉伸指数模型,和高分辨率DWI等,在此对DWI相关的技术做简单介绍. 弥散加权成像(Diffusion Weighted Imaging, DWI)是一种在分子水平上无创地反映活体水分子的无规则热运动状况的成像方法,成像 ...

  • 肺腺癌新分类--影像学解读
  • 2011年8月第11卷第4期 循证医学 T11eJoumalofEvidence.BasedMedicine Aug.2011V01.1l No.4 肺腺癌新分类--影像学解读 赵振军 (广东省人民医院影像医学部放射科.广东省医学科学院,广州510080) [关键词] 肺腺癌:分类:影像学 [中图分 ...

  • 肿瘤细胞免疫原性低下
  • 肿瘤细胞免疫原性低下--MHCI类分子减少或缺乏(肿瘤细胞,类分子,免疫,抗原,肿瘤抗原) 肿瘤细胞 类分子 免疫 肿瘤抗原 抗原 位点 肿瘤 宿主 标题: 肿瘤细胞免疫原性低下--MHCI类分子减少或缺乏(肿瘤细胞,类分子,免疫,抗原,肿瘤抗原) 摘要: [肿瘤细胞免疫原性低下--MHCI类分子减 ...

  • 微量尿蛋白的实验室检测
  • 微量尿蛋白的实验室检测 什么是微量尿蛋白? 肾脏具备强大的代偿功能,肾功能早期损伤往往没有症状和体征,患者就诊时已经到达肾功能不全,失去了最佳的治疗机会. 在早期损伤时尿蛋白已有微量的增加,但还不能用常规方法检测出,此时称为微量尿蛋白,是肾病早期损伤的最敏感变化. 目前用于实验室检测的微量尿蛋白有哪 ...

  • 液体活检技术在肿瘤诊断领域的研究进展
  • ・327・ ・综述・ 液体活检技术在肿瘤诊断领域的研究进展 孙宇乔 贾学渊 于旸 [摘要] 近年随着人们对循环肿瘤细胞(circulatingtumorcells,CTCs)和循环肿瘤DNA(circulatingtumorDNA,ctDNA)的认识逐渐加深,一种新兴的以血液为基础的肿瘤分子诊断应时 ...

  • (综述)结直肠癌中的微卫星不稳定性
  • 结直肠癌至今依然是西方国家最主要的公共卫生问题,在男性和女性常见癌症中均排在前三位.结直肠癌的5年总生存率接近65%,根据疾病的等级略有差别(Ⅰ期生存率达90%,而Ⅳ期生存率仅为15%).随着新筛查手段的出现,2015年有超过70%的新发患者实施预防性的切除手术. 尽管传统的临床病理分期仍用于结果的 ...

  • Ki67表达在乳腺癌新辅助化疗中的临床意义
  • 60 实用医院临床杂志2012年7月第9卷第4期 Ki67表达在乳腺癌新辅助化疗中的临床意义 a a b a a a a a 张好云,陈天文,王开昕,陶霖玉,彭丽华,梁亚男,王红鲜,林秋生 (广东医学院附属南山医院a.甲乳外科,b.病理科,广东深圳518052) [摘要]目的探讨Ki67表达与乳腺癌 ...

  • 分子靶向抗肿瘤药物与生物标志物_丁健
  • 分子靶向抗肿瘤药物与生物标志物 丁健 (中国工程院院士.中国科学院上海药物研究所所长) 当今抗肿瘤药物研发正经历着从传统细胞毒类药物向分子靶向药物转变的重大变革.首个小分子靶向药物Gleevec 的成功上市,见证了分子靶向药物研发成功与失败相伴的曲折历程,分子靶向抗肿瘤药物的学术价值.经济效益与社会 ...