MicroRNA Targeting Specificity in Mammals: Determinants Beyond Seed Pairing

Andrew Grimson; Kyle Kai-How Farh; Wendy K. Johnston; Philip Garrett-Engele; Lee P. Lim; David P. Bartel

doi:10.1016/j.molcel.2007.06.017

分子细胞。作者手稿；PMC 2013年10月19日提供。

以最终编辑形式发布为：

分子细胞。2007年7月6日；27(1): 91–105.

数字对象标识：2016年10月10日/j.molcel.2007.06.017

预防性维修识别码：项目经理3800283

美国国立卫生研究院：NIHMS515910标准

PMID：17612493

哺乳动物靶向MicroRNA的特异性：种子配对以外的决定因素

安德鲁·格里姆森，^1,^{2的情况下，}⁵ 凯尔·凯·霍法尔，^1,^{2的情况下，}^三，⁵ 温迪·约翰斯顿，^1,² 菲利普·加勒特·恩格尔，⁴ Lee P.Lim先生，^4,^*和大卫·P·巴特尔^1,^{2的情况下，}^*

作者信息版权和许可信息 PMC免责声明

关联数据

补充资料: 补充。
NIHMS515910-补充-补充.pdf（1.2米）
GUID:EED8484F-159D-4973-B31F-93DFFB3DABC8

总结

哺乳动物microRNAs（miRNAs）与mRNAs的3'UTR配对，以指导其转录后抑制。与miRNA种子区域匹配的~7-nt位点对靶点识别很重要。然而，这些种子匹配并不总是足以抑制，这表明其他特征有助于确定靶点。通过结合计算和实验方法，我们发现了提高位点功效的位点上下文的五个一般特征：位点附近富含AU的核苷酸组成，与共表达miRNA的位点的接近（这导致协同作用），与miRNA核苷酸13-16配对的残基的接近，并定位在3'UTR内，距离终止密码子至少15 nt，远离长UTR的中心。结合这些上下文决定因素的模型可以定量预测外源性添加的miRNAs和内源性miRNA-信息相互作用的位点表现。由于该模型可以在不依赖进化保护的情况下预测位点功效，因此还可以识别有效的非保守位点和siRNA非靶点。

介绍

微RNA是~22-nt的内源性RNA，与蛋白质编码基因的信息配对以指导这些mRNA的转录后抑制(巴特尔，2004年). 了解其功能的一个中心目标是了解他们如何识别目标消息。保守性Watson-Crick配对到miRNA的5'区域，包括miRNA种子，可以预测假阳性预测背景之上的目标，这表明该区域对miRNA目标识别的重要性(Lewis等人，2003年;Brennecke等人，2005年;Krek等人，2005年;Lewis等人，2005年). 超过三分之一的人类基因似乎受到选择性压力，无法与miRNA种子配对(Lewis等人，2005年)，许多信息在miRNA异位表达后减少或在miRNA敲除后增加，与miRNA种子相匹配(Krutzfeldt等人，2005年;Lim等人，2005年;Giraldez等人，2006年;罗德里格斯等人，2007年).

引入miRNA后下调的消息与四种类型的位点最为相关，这与预期的同源UTR位点优先保守性一致（Farh等人，正在准备中）。其中包括一名6名、两名7名和一名8名(图1A). 6分子与miRNA种子（miRNA核苷酸2-7）完美匹配(Lewis等人，2005年). 最好的7mer位点，这里称为7mer-m8位点，包含与miRNA核苷酸8匹配的种子匹配(Lewis等人，2003年;Brennecke等人，2005年;Krek等人，2005年;Lewis等人，2005年). 同样有效的还有另一个7mer，即7mer-A1位点，它包含在目标位置1由A增强的种子匹配(Lewis等人，2005年). 第8个位点包括种子配对，两侧是第8位的配对和第1位的A配对(Lewis等人，2005年).

在单独的窗口中打开

图1

下调6-8个站点的消息

（A）典型miRNA互补位点。

（B）单一典型位点的有效性。用微阵列监测miRNA转染后mRNA丰度的变化。图中显示了UTR中包含指定单站点的消息的变化分布（0.1个单元箱）（左）以及累积分布（右）。累积分布中的虚线表明，27%含有单一8聚体UTR的mRNA表达下调至少29%（2^−0.5=0.71）。11个实验的结果，每个实验重复进行，每个实验转染不同miRNA的双链(表S2)，已合并。结果显示，所有11个miRNAs的数据混合在一起；当分别检测每个转染时，不同位点的相对强度是一致的。对于累积图，基于与无位点分布的比较，报告了该分布中下调基因的最小比例（括号）。含有8mer位点的UTR的抑制作用显著高于含有7mer-m1位点的UTRs(对< 10⁻²⁰，单侧K-S试验）；含有7mer-m8位点的UTR与含有7mer-A1位点的UTRs、含有7mer-A1位点与含有6mer位点的UTR-s以及含有6mer与不含6mer位点UTRs之间的相似比较也具有显著性(对< 10⁻⁶，对< 10⁻²⁰和对< 10⁻³¹）。

（C）提高了双站点的效率。监测miRNA转染后mRNA丰度的变化，如B所示，但3'UTRs包含指定位点对的mRNA除外。同时含有8 mer和7 mer或8 mer位点的UTR的抑制作用显著高于含有两个7 mer-m8位点的UTRs(对< 10⁻³，单侧K-S试验）；含有两个7mer-m8位点的UTR与两个7mer-A1位点的UTRs、两个7mr-A1位点与两个6mer位点的UTR-s以及两个6mer位点与无7mer-A1位点之间的类似比较也具有显著性(对=0.034，对< 10⁻¹¹和对< 10⁻⁶分别）。

（D）大多数双站点的独立性。含有指定miRNA结合位点组合的信息在miRNA转染后mRNA水平变化的累积分布。通过结合两个单一7mer的影响，计算出含有两个7mer位点（绿色）的3'UTR的模拟值；包含两个7mer的3'UTR的实际值为蓝色，包含单个7mer长度匹配UTR的值为紫色；否则如图1B所示。

（E）紧密间隔站点之间的协同作用。关于（D），mRNA水平变化的累积分布，除了两个观察到的位点（蓝色）的图，仅考虑包含两个紧密间隔的7mers的3'UTR（彼此之间在100 nt以内）。与含有一个加一个位点的模拟UTR相比，含有两个相邻位点的UTR的抑制显著增加(对=0.040，1000次重采样迭代），而包含两个位点的UTR的抑制与包含一个加一个位点的模拟UTR没有显著差异(对= 0.81).

（F）按不同间隔对双站点进行选择性维护。基于面间距离（计算第一个位点的3'nt和第二个位点的5'nt之间的核苷酸数量），将人类3'UTR与同一miRNA的两个7mer位点进行组合。在对每个bin位点进行类似于Lewis等人（2005年）使用在脊椎动物中广泛保存的miRNA家族(表S1).

（G） MicroRNA-介导的荧光素酶报告基因的抑制融合到包含两个不同间距miR-124靶位点的3'UTR片段。将转染控制标准化后，将与每个报告构建物及其同源miRNA（miR-124）共同转染的HeLa细胞的荧光素酶活性标准化为与每个报告者及其非同源miRNA共同转染时的荧光素酶活性。绘制的是标准化值，误差条代表12个重复中的第三大值和第三小值。对值（Wilcoxon秩和检验）表明，来自包含这两个位点的报告者的抑制（蓝色）是否显著大于乘法效应的预期（绿色）。为了模拟位点的独立活动，具有两个位点的报告者所期望的抑制是包含单个完整位点（紫色和黄色；按生成顺序配对抑制值）的相同报告者所观察到的抑制的产物。最右边的五重奏组的记者与最左边的五重唱组的记者完全相同，只是破坏目标场地的换位不同。

（H）如在（G）的最左边的五分之一中观察到的报告构建体的抑制，但被修饰以使两个miR-124位点被miR-1位点取代。miR-196作为非同源miRNA。

（一）与这些片段的突变衍生物相比，含有3'UTR片段的报告基因结构具有自然紧密间隔的miR-1和miR-133位点的抑制。miR-1和miR-133的混合物被联合转染为同源miRNA，miR-196作为非同源对照。

（J） HeLa中转染位点和内源性miRNAs之间的合作性。考虑的内源性位点为let-7RNA、miR-16、miR-21、miR-23、miR-24、miR-27和miR-30（Tom Tuschl，个人通信）。与内源性miRNA 7-8mer位点（≤7nt，包括重叠位点；对=0.0054，单侧K-S检验），或不接近内源性位点（≥40 nt，或无内源性位点，对=0.036，单侧K-S试验）。

报告者分析表明，与种子配对不仅对识别很重要，而且在某些情况下7-8分子位点似乎足够(Doench和Sharp，2004年;Brennecke等人，2005年;Lai等人，2005年). 然而，种子位点并不总是传递抑制，当抑制发生时，抑制的程度在不同的UTR上下文中是高度可变的。在动物中，优先在同一组织中表达的信息与高表达的miRNA具有3'UTR，在7mer位点中约50%耗尽，可能是因为这些信息在该组织中具有重要作用，并且在进化过程中，它们避免获得共表达的miRNAs的位点，以免损害其功能(Farh等人，2005年). 然而，这些UTR并非完全没有7mer位点，这表明即使在体内的miRNA位点中，也存在类似的位点功效变异性，因此相同的7mer位置可能是重要的，也可能不是重要的，这取决于它们出现的UTR背景。因此，具有典型的7-8聚体位点显然很重要，但通常不足以检测到下调；种子位点以外的未知上下文决定因素也必须在目标识别中发挥重要作用。

在不了解这些背景决定因素的情况下，实验主义者面临着困难的挑战。当他们试图了解miRNA敲低或异位表达研究引起的表型的分子机制时，应该从哪里开始？一种方法是只关注保守位点，但如此多的信息处于选择性压力下，无法与miRNA配对——平均每个高度保守的哺乳动物miRNA家族有200多条信息——这种方法只能缩小领域，同时可能会排除一些进化速度更快的物种间的相互作用(Farh等人，2005年;Krek等人，2005年;Krutzfeldt等人，2005年;Lewis等人，2005年;Giraldez等人，2006年).

我们着手发现有助于确定miRNA靶向的上下文特征，其想法是，对靶识别的这种洞察力将提高预测功能位点的能力，包括那些保守的和那些不保守的功能位点。我们发现了五个影响目标定位的独立特征，每个特征都有实验和计算支持。结合这些决定因素，我们构建了一个miRNA调节模型，该模型能够仅基于序列定量预测miRNA位点的性能，我们通过实验证实了该模型对外源添加的miRNA和内源性miRNA信息相互作用的预测能力。由于我们的方法准确区分了有效位点和非有效位点，而不考虑位点保护，因此它也为识别siRNA非靶点提供了基础。

结果和讨论

距离较近的站点通常会协同工作

当检查来自11个miRNA转染实验的mRNA微阵列数据时，微阵列上检测到的下调信息中的大多数（75%）在其3'UTR中具有典型的7-8mer位点（Farh等人，正在准备中）。然而，只有少数在3'UTR中具有单个站点的消息在阵列上显示出可检测到的不稳定（7mer-A1、7mer-m8和8mer分别为19%、25%和43%，图1B)这表明，分析那些被检测到下调的消息和那些没有下调的消息之间的差异，可以帮助识别对目标识别很重要的上下文特征。

如先前研究所预期(Doench和Sharp，2004年;Brennecke等人，2005年;Lai等人，2005年)，在我们的转染实验中，多个位点与更大的mRNA失稳相关(图1B和1C). 当考虑所有基因时，如果这两个位点对抑制独立起作用，那么观察到的两个位点的抑制几乎与预期的完全一样；也就是说，对具有两个位点的基因的抑制与通过将两个单一位点的抑制相乘得到的预期结果相匹配(图1D). 这种增殖效应是独立和非合作作用的标志，之前在一个设计用于模拟miRNA阻遏的异源报告试验中观察到(Doench和Sharp，2004年).

我们观察到明显独立作用的总体趋势有一个显著的例外：当两个位点靠得很近时，抑制作用往往大于两个单一位点独立作用的预期值(图1E). 通过检查人类、小鼠、大鼠和狗的同源UTR中的位点保守性，我们发现在绘制真实miRNAs的共保守性位点数量时，减去对照组共保守者位点的平均数量后，最大的富集是紧密间隔的双位点(图1F). 虽然大多数共同保守位点的间隔较长（因为较长的间隔大大超过较短的间隔），但与任何其他特定间隔相比，观察到的富集表明对较短间隔具有可检测的生物学偏好。这种两侧间隔较短的病例似乎更有效，因此最容易从基因上识别。根据这个想法秀丽线虫lin-4:第14行和lsy-6型:齿轮-1相互作用和果蝇属miR-4：胡子相互作用都涉及具有短间距的双保守8分子位点(Lee等人，1993年;Wightman等人，1993年;约翰斯顿和霍伯特，2003年;Lai等人，2005年); 看见targetscan.org网站对秀丽线虫站点注释）。

我们使用报告分析进一步调查了这一现象，检查包含两个位点的UTR片段，并询问从这两个位点观察到的阻遏是否大于从单独位点预计的阻遏性（计算预期阻遏值，作为单独测量两个位点时阻遏数值的乘积）。观察到的抑制偏离预期最大的两个UTR片段对应于所检测的两个最短的相距(图S1). 例如，两个近端miR-124位点单独介导的只是轻微的下调，而这两个位点共同介导的下调更为强烈，这是显著的协同作用(图1G，最左侧）。使用两种不同插入序列中的任何一种，将干预nt的间距从19增加到56，完全消除了合作性，而将其增加到只有34 nt并没有(图1G). 当两个站点都改为miR-1站点时，保持了合作(图1H). 重要的是，仅包含完整上游或下游位点（分别为紫色或黄色条带）的UTR的阻遏并没有被所采用的不同侧间序列显著改变。

如果两个不同miRNA的位点能够协同作用，那么合作miRNA功能的机会将大大增加。为了测试这种可能性，我们基于含有miR-1和miR-133的紧密间隔位点的UTR片段对记者进行了测试，这两种miRNAs在肌肉细胞中共同表达(图1I). 对于miR-1和miR-133的混合物，具有8-nt间期间隔的细胞表现出协同抑制。具有4-nt间距的miRNA没有，我们将其归因于间距太近，因为通过将间距再延长6nt来实现协同性。为了更广泛地测试不同miRNA的位点在紧密间隔时是否协同作用，我们检测了转染miRNAs的位点是否更有效，如果它们靠近细胞内生表达miRNAs的位点。当内源性和转染miRNA位点之间的间距为8至~40 nt时，抑制最强(图1J).

我们得出结论，影响位点有效性的重要背景决定因素之一是它们与共表达miRNAs位点的接近程度。在我们的论文审查期间发表的一份最近的报告得出了类似的结论(Saetrom等人，2007年). 协同miRNA功能意味着抑制对miRNA水平的微小变化更加敏感的机制。此外，共表达miRNA位点的协同性大大增强了组合miRNA表达的调控作用和效用。

核苷酸12-17的额外Watson-Crick配对增强miRNA靶向性

通常认为与miRNA的3'部分配对可以增强对典型7或8分子位点的抑制。然而，当我们使用之前开发的基于能量的量规预测和评分3'补充配对时(Lewis等人，2003年;John等人，2004年;Krek等人，2005年)得分较高的网站效果不佳；事实上，根据这些标准衡量，增加补充配对似乎不利于疗效(图S2A). 我们还研究了一种不同方法的结果，该方法预测了miRNA长度上具有广泛Watson-Crick和G:U配对的位点，并容忍了不完美的种子匹配(Miranda等人，2006年). 然而，在排除了那些带有典型种子站点的预测之后，其余的执行效果并不比没有站点的消息好(图S2B). 因此，我们寻找了一个量规，该量规实现了识别生产性3'配对的预期目的，在系统地改变配对位置、连续性和身份（±G:U对）的同时评估位点效能。总的来说，间接配对优先涉及Watson-Crick配对到miRNA核苷酸12-17，尤其是核苷酸13–16(图2A). Watson-Crick与四个连续核苷酸的配对在13位开始时与下调最相关(图2B). 关于与miRNA 3'区配对的UTR片段的位置，最理想的排列方式是将其直接放置在miRNA链的对面，尽管几个相邻的寄存器也有效(图2C).

在单独的窗口中打开

图2

有益3'配对的特点

（A）配对方案，突出miRNA（橙色）和3'UTR（绿色）之间生产性3'配对的核心区域。

（B） miRNA 3'区域内补充配对的优先位置。从具有代表性的脊椎动物miRNAs的7mer-m8位点开始表S1在miRNA的3'端滑动一个4mer窗口，在消息的相反区域搜索Watson-Crick匹配。将3'配对分数分配给每个miRNA 4mer，将4mer内的每个相邻配对的一个分数记为1分，将相邻配对向上游延伸1 nt的半分，将其向下延伸1 nt。miRNA 4mer及其补体在信息中的位置允许偏移，但偏移量超过±2 nt的每个核苷酸被评估为½分惩罚，并且不允许与已经与miRNA种子区域（1-8）配对的信息位置配对。当4mer有相邻配对的替代区域时，它被分配到替代得分最高的区域。对于每个位置，确定得分和阵列下调之间的Spearman相关性对绘制的值。

（C） miRNA和mRNA配对区域之间的首选偏移。使用固定在miRNA核苷酸13-16处的4聚体重复分析（B），并评估评分和下调之间的相关性，以确定替代配对偏移。正偏移将miRNA 3'配对片段相对于消息向右移动。

（D）保守配对的优先位置。对人类3'UTR进行扫描，寻找与miRNAs表S1对于从miRNA第9个核苷酸开始的每个相邻的4聚体，我们搜索了互补的Watson-Crick 4聚体（在消息中正好相反），允许±2-nt偏移，并排除重叠到核苷酸1-8中。那些种子及其补充4mer共同保守的情况被认为是3'配对的保守情况。将其与具有相同5'种子序列但具有不同miRNA 3'末端的对照嵌合miRNA序列进行比较，并计算信号/背景。重复分析3分钟和5分钟。

（E） 4mers在同源人类miRNAs中保守。对于每个位置，显示了具有完全保守的4mer的人类miRNA家族的数量；只有一个人类伞降的家庭被排除在外。

（F） 7mer-m8位点的有效性通过良好或较差的3'配对进行补偿。用微阵列监测miRNA转染后mRNA丰度变化的分布（左）和累积分布（右），如图1B包括典型8分子位点的结果供参考。配对良好的位点为得分≥4的位点，配对不良的位点为分数≤2的位点。配对得分如（B）所示，但使用与核苷酸13-16相对应的固定miRNA 4mer，并将其他地方的连续配对计算为每对0.5分。配对良好的网站比配对不良的网站更有效(对=0.007，单侧K-S试验）。

谈到进化保守性，当Watson-Crick与四个相邻的miRNA核苷酸配对开始于miRNA位置12、13或14时，这种配对更为保守(图2D)有效3'配对核心的相同核苷酸是种子区外最保守的miRNA核苷酸(图2E). 因此，场地保护结果与阵列的实验结果一致，正如我们的标准所确定的，如果补充配对会影响动物的蛋白质输出，这也是可以预期的。

3’配对和种子配对之间的相似性是惊人的。与种子配对类似，3'配对对预测的热力学稳定性相对不敏感，而对几何形状相当敏感，更喜欢连续的Watson-Crick配对不受摆动、凸起或其他不匹配的影响。与种子配对一样，3'配对对位置敏感，3'核心（13-16位）的配对对疗效比与其他位置的配对更重要。

根据位点功效和保守性分析得出的指导原则，我们开发了一个简单的方案，根据整个miRNA 3'端的奖励配对来评分3'配对，但特别强调13-16核苷酸区域。比较高得分位点和低得分位点的疗效表明，3'配对是一个有效的决定因素，尤其是对于7mer-m8位点(图2F)尽管震级小于7mer位点和8mer位点之间的差异。

我们怀疑非常广泛的3'配对可能比在图2F，但这种非常广泛的配对太罕见了，无法在我们的阵列分析中进行可靠的评估。在哺乳动物的生物靶向过程中，广泛的3'配对似乎也很少被使用。例如，在背景以上保守的具有广泛3'配对（包括≥5个相邻且位置良好的配对）的典型位点（6-8个）的数量平均为每个miRNA家族两个。尽管如此，我们预计我们的检测结果3'配对的指南将有助于识别不寻常但重要的情况，在这些情况下，广泛的3'配对对哺乳动物靶点抑制至关重要。例如，3'配对可以帮助弥补不完美的种子配对(Doench和Sharp，2004年;Brennecke等人，2005年)以及一些具有广泛3'补偿性配对的网站，包括let-7中的站点秀丽线虫lin-41和哺乳动物的miR-196位点霍克斯B8已知在哺乳动物细胞中起作用(Reinhart等人，2000年;Lewis等人，2003年;Yekta等人，2004年). 在所有这些情况下，使用我们的量规（≥10个相邻Watson-Crick碱基对），这些站点的得分都会非常高。

有效站点优先位于本地AU丰富的环境中

当根据位点在微阵列上的表现将其分为功能位点和非功能位点时，我们发现紧邻功能位点两侧的核苷酸相对于非功能位点的A和U含量高度富集(图3A，绿色地块）。这种局部AU含量高的现象在现场附近很重要，然后迅速下降。与阵列数据一致的保守和非保守miRNA位点相邻的局部核苷酸组成的比较；与非保守位点两侧的核苷酸相比，紧邻保守位点的核苷酸在A和U含量上高度富集(图3A，蓝色图）。

在单独的窗口中打开

图3

当地AU含量的实质性影响

（A）有效和保守的8分子位点附近的首选核苷酸组成。对于位点效能分析（绿色），将表达阵列中与最大下调相关的位点（下调排名前三分之一的位点）与与最小下调相关的部位（下调排名后三分之一）进行比较。在每个位置，从现场开始计算，绘制出AU成分在±5-nt窗口内的分数差。重复进行保守分析（蓝色），比较11个miRNA家族保守位点与非保守位点两侧的核苷酸组成(表S1).

（B）不同类型站点的AU组成权重。对于该位点上游和下游30 nt范围内的每个位置，A或U的存在使该位点的得分增加了与该核苷酸条形高度成比例的量。离开现场时，重量（钢筋高度）随距离现场距离的倒数而减小。例如，8聚体下游核苷酸的重量是8聚体上游核苷酸重量的1/2、1/3、1/4、1/5。

（C）具有不同本地AU含量的8 mer（左）和7 mer-m8（右）站点的有效性。根据（B）的准则，将位点分为四个四分位数。为了便于参考，包含了另一个标准位点的结果（灰色），否则如图1B对于这两种站点类型，具有最高局部AU含量的四分位显著低于具有最低局部AU成分的四分位数(对< 10⁻⁷对于8mer站点，对< 10⁻²⁹对于7mer-m1位点）。

（D）站点完成分析表明，具有较高局部AU组成的站点具有更大的功效。为了评估位点在不同局部AU环境中的功效，根据其局部AU含量将位点在中位数处划分为两个大小相等的组，并对每个组织miRNA对进行耗尽分析。对值表示单个对的损耗程度。网格上的方框表示miRNA表达的那些对，在这些对中，高度表达的信息预计在miRNA的位点中消耗最多。

我们制定了一个准则，考虑到种子点上游30 nt和下游30 nt的残留物的组成，用距种子点距离的倒数加权尾数(图3B). 根据我们的量规，在前四分位的7分位得分至少与在后两个四分位中的8分位得分一样有效，这说明了局部AU成分对局部疗效的实质性影响(图3C).

作为对高局部AU密度内的位点是否对动物更有效的额外测试，我们进行了位点完整性分析。这项分析的基础是发现，与miRNA优先表达在同一组织中的信息在与miRNA匹配的位点中被耗尽，因为这些高表达的信息受到选择性压力，以避免有害的抑制(Farh等人，2005年). 根据我们的量规测量，与低AU密度的位点相比，高AU密度内的位点在优先与miRNA共表达的信息中显著减少(图3D，对< 10⁻⁶，单侧K-S试验）。由于与位点保护一样，位点耗竭是动物蛋白质下调的一种功能，我们的结果表明，局部AU含量不仅影响mRNA的失稳，还影响蛋白质的表达。

3'UTR中较高的全球AU组成也与较高密度的保守miRNA互补位点以及更广泛的3'UTRs保守相关(罗宾斯出版社，2005年). 当考虑整个3'UTR的核苷酸组成时，我们观察到总AU含量与阵列疗效之间的相关性。然而，这种相关性没有局部成分那么强，在考虑了局部AU背景后，全局AU成分没有显著的残差相关性，这表明全局AU成分不会直接影响部位疗效。

由于在位点附近对A’s和U’s的偏爱似乎只涉及偶然的Watson-Crick配对，因此该局部AU决定簇与核苷酸1对A的偏爱相似，从而将位点识别的明显非Watson-Crick成分延伸到位置1之外。事实上，在这个位置对A的偏爱可能被认为是局部AU效应的一个组成部分，偏向于A而不是U。局部AU密度也解释了为什么以前设计的识别和评分3'配对的方法对寻找更有效的位点起反作用(图S2A). 每种方法都使用预测的折叠自由能来得分3’配对(Lewis等人，2003年;John等人，2004年;Krek等人，2005年). 局部GC含量较高的地区存在的种子位点，由于偶然的GC碱激发，往往预测3'配对具有更好的折叠自由能，但实际上它们的效果显著较差。

有效站点优先位于3'UTR，但不要太靠近Stop Codon

尽管对miRNA功能的大多数研究都是针对位于3'UTR的位点，但哺乳动物基因的5'UTR和开放阅读框（ORF）平均包含的序列长度是3'UTRs的两倍，并且人工siRNA可以在整个信息中的完全互补位点上直接切割。对于单个8聚体位点，我们在5’UTR中未观察到可检测的疗效，在ORF中可检测但疗效有限，在3’UTR上疗效较高(图4A). 这些结果反映了先前的站点保护分析、表达式数组和站点完整性分析的结果(Farh等人，2005年;Lewis等人，2005年;Lim等人，2005年).

在单独的窗口中打开

图4

终止密码子15nt以内的位点疗效不佳

（A） miRNA转染后具有一个8mer位点的信息水平变化的分布（左）和累积分布（右），分析和显示如下图1B。在3'UTR或ORF中有一个站点的消息比没有站点的消息受到更大的抑制(对< 10⁻¹²⁶和<10⁻¹⁶（分别为），而5'UTR中没有(对= 0.181).

（B）终止密码子附近区域7-8分子位点的保护。绘制的是以所示mRNA位置为中心的±5-nt窗口中每个核苷酸在背景以上保存的位点数量，位置0是3'UTR的第一个核苷酸。如果7-8聚体中最长5'的核苷酸在窗口内，则将该位点作为窗口内进行评分。

（C）融合到含有miR-124位点或突变衍生物的3'UTR片段的荧光素酶报告基因的MicroRNA-介导的抑制。在对转染进行归一化处理后，与每个报告构建物及其同源miRNA（绿色和蓝色条）共同转染的HeLa细胞的荧光素酶活性被归一化为与非同源miRNA共同转染每个报告者的荧光素酶活性（紫色和橙色条）。误差条代表18个重复中的第四大和第四小值。对值（Wilcoxon秩和检验）表明，含有原始ORF（蓝色）的报告者的抑制作用是否显著大于含有从上游位置停止9nt的扩展ORF的报告者（绿色）。

当绘制高于偶然性的保守位点的数量时，我们发现这个在ORF中较低的数量在终止密码子后的第一个~15 nt保持较低，因此ORF靶向和3’UTR靶向之间的转换并没有精确地发生在终止密码子处，而是在下游约15 nt处偏移(图4B). 与这一发现一致，与3'UTR中的其他位点相比，位于终止密码子15 nt内的3'UTRs位点在阵列上的有效性更低(对<0.01，对于单侧K-S测试，将消息的表达值与8mer进行比较，数据未显示）。进一步支持这些发现的是来自报告者的结果，除了两个核苷酸破坏了两个终止密码子外，其他结果都是相同的，从而将ORF延长了69个残基，并使位于miR-124位点8 nt范围内的终止密码子投入使用(图4C). 这两个点的替换，都是在站点上游70 nt以上，特别是取消了站点的功能，而对下游站点的功能没有影响(图4C). 这些结果证实，紧跟在终止密码子之后的片段不适合作为靶点。

有效场地优先位于3'UTR两端附近

当检查3’UTR剩余部分内的站点位置是否影响性能时，我们发现位于长UTR两端附近的站点通常比位于中心附近的站点更有效(图5A;对=0.0011，皮尔逊相关）。此外，位点保护分析显示，在末端附近选择性地保持的位点多于在中部区域(图5B;对< 10⁻⁴，皮尔逊相关性）。与miRNAs优先共表达的信息中的位点缺失在长UTR末端附近也比在中心附近更严重，这表明如果新出现的位点位于末端附近，那么它们更有可能在动物体内发挥作用(图5C，对=0.032，单侧K-S试验）。因此，所有三种证据——监测mRNA失稳的实验方法，以及处理动物蛋白质输出的两种计算方法——都表明，ORF附近和聚（A）尾巴附近的UTR四分位数比两个中心四分位数更适合有效靶向。这种影响对于较长的UTR（>1300 nt）最为明显。

在单独的窗口中打开

图5

长3'UTR中间附近站点的性能较差

（A）居住在3'UTR不同位置的8人抑制相关位点的分数。根据位点的相对位置（与终止密码子的距离除以UTR长度），将至少1300 nt带有单个8聚体位点的UTR分为10个等距的箱子。对于每个箱子，绘制的点对应于平均站点位置和阈值下调的消息部分对在微阵列上<0.05。这些线是对所有数据的最小二乘拟合，使用的模型假设UTR两端的影响相等。

（B）居住在3'UTR不同位置的8人在背景以上保守的位点数量。将至少1300nt的UTR分为10个等距的仓，每个仓绘制对应于平均位点位置和在背景上方保守的位点数量的点。这些线是对装箱数据的最小二乘拟合，使用的模型假设UTR两端的影响相等。

（C）站点完成分析表明UTR末端附近站点的效率更高。为了评估不同UTR区域中位点的功效，将至少1300 nt的小鼠UTR的总3'UTR序列分为中半部分（右侧面板）和剩余的两个末端四分之一（左侧），并对每组进行耗竭分析，如下所示图3D.

站点效能的定量模型

为了开发一种定量工具来预测单个位点的功效，无论其进化保守性如何，我们使用线性回归来建模阵列的下调与单个7mer-m8位点的上下文之间的关系。为了建立一个通用于各种细胞类型的模型，没有考虑共表达miRNAs位点的邻近性。排除了5'UTR、ORF或终止密码子15nt内的位点，这与我们的结果一致，表明这些位点通常无效(图4). 对于与miRNA的3'区域的额外配对，按照图2F，得分等于相邻配对碱基的最大数量，加权为核苷酸13-16配对(图6A). 对于本地AU组成，分数按照图3B得分越高，表明场址两侧地区的当地非盟组成越大(图6B). 对于位置效应，分数基于3'UTR位点与最近端之间的核苷酸距离(图6C).

在单独的窗口中打开

图6

考虑场地环境预测场地效能的定量模型

（A）使用更多3'配对的7mer-m8站点的效率提高。使用单个站点的消息按照图2F对于每个分数，绘制微阵列上的平均下调曲线。回归线是对完整数据的最佳最小二乘拟合，表示得分与数组下调之间的关系(对< 10⁻³，r=−0.07，皮尔逊相关）。平均日志₂显示折叠变化（−0.161）（虚线）。配对得分<1或>5的少数位点分别折叠到第一个和最后一个箱子中。

（B）在较高的局部AU含量范围内，7mer-m8位点的效力增加。根据中所述的评分，将具有单个站点的邮件分为14个大小相等的箱子图3B，其中1.0等于最大可能得分。对于每个bin，绘制的点对应于微阵列上的平均得分和平均下调，直线拟合如（A）所示(对< 10⁻³²，r=−0.21，皮尔逊相关）。

（C）距离3'UTR末端更远的7mer-m8位点的疗效降低。根据与最近的UTR端的距离，将具有单个站点的消息拆分为14个大小相等的箱子，并按（B）所示绘制点和回归线(对< 10⁻⁸，r=0.11，皮尔逊相关）。

（D）单个7mer-m8位点的预测疗效与观察疗效之间的对应性。根据上下文得分，将具有单个站点的消息分为14个大小相等的箱子，通过预测三个上下文决定因素（面板a–C）平均值的偏移量，然后将这三个贡献添加到平均日志中，计算出每条消息的上下文得分₂7mer-m8站点的折叠变化(图S6). 点对应于每个箱子的平均得分和平均下调。回归线是最适合完整数据的最小二乘法(对< 10⁻⁴⁵，r=0.25，皮尔逊相关）。

（E）当应用于未用于派生模型的数据集时，组合模型的性能。显示了siRNA转染后信使核糖核酸水平变化的累积分布（Jackson等人，2003），在首次使用上下文得分预测顶部和底部四分位数后，上下文得分如（D）中计算，用于siRNA的单个7mer-m8位点的信息(图S5); 否则，如所示图1B(对< 10⁻³¹，双面KS测试，比较顶部和底部四分位数）。

（F）一个统一的模型，考虑7-8分子标准位点的差异效力和上下文决定因素的影响。根据该位点在小鼠、大鼠和狗的同源UTR中是否保守，将具有单个7mer-A1、7mer-m8或8mer位点的人类信息分为两组。对于每个站点，使用面板a–C的回归和其他两种类型站点的类似回归来计算上下文得分(表S6). 对于保守（橙色）和非保守（蓝色）集，根据上下文得分将位点分为14个bin，并绘制每个bin的平均得分和平均抑制。回归线适合完整数据（保守：对< 10⁻²⁴，r=0.25，不合格：对< 10⁻⁵⁰，r=0.32，皮尔逊相关性）。

（G）根据上下文得分（F）进行排名，预测不同类型网站在有利或不利环境中的表现。所示为下调消息的最小数量，使用（E）等累积分布进行计算。

（H） MicroRNA介导的荧光素酶报告基因的抑制融合到3'UTR片段，该片段包含一个位于有利环境中的7mer-m8 miR-25位点。将转染控制标准化后，与每个报告构建物及其同源miRNA（miR-25）共转染的HEK293细胞的荧光素酶活性标准化为与突变miR-25位点和同源miRNA共转染报告者的荧光素酶活性，将联合转染的野生型报告基因结构和非同源miRNA（miR-196）的荧光素酶活性归一化为联合转染突变型报告基因和非同源micRNA的荧光素酶活性。绘制出归一化值，误差条代表12个重复中第三大和第三小的值，当比较同源和非同源miRNA的结果时，显示出明显的抑制作用（*，对< 0.01; **,对< 0.001; Wilcoxon秩和检验）。在每个基因名称下面是miR-25位点的上下文分数，以及用于计算此分数的三个上下文贡献，如（D）所示。

（一） MicroRNA-介导的荧光素酶报告基因的抑制融合到3'UTR片段，该片段包含一个7mer-m8 miR-25靶点，位于不利环境中，否则如（H）所示。

每个上下文特征的得分没有显著的相关性(图S4)，表明它们的影响可以独立考虑，并组合成一个单一的模型(图6D). 当对一系列独立的siRNA转染进行测试时，该模型准确地预测了因siRNA而导致的信息不稳定(图6E)，并且模型的各个特征各自有效(图S5). 这一结果表明，我们的模型对其推导中未使用的数据具有预测性，并证明它适用于siRNA的非靶向性以及miRNA的靶向性。

使用相同的方法，我们考虑了8 mer、7 mer-A1和6 mer站点，并将这些站点的模型合并为一个统一的模型。为了解决进化保守性如何影响模型的问题，分别绘制了保守性和非保守性位点的影响图(图6F). 对于保守和非保守站点，统一模型在预测和观察到的消息稳定性影响之间产生了明确的对应关系。尽管如此，得分相同的保守位点比非保守位点更有效(对< 10⁻¹¹，双面KS试验）。也许还有其他未经特征化的上下文特征有待发现，并且一直处于优化的选择性压力之下，从而使保守位点的观察效率更高。或者，我们的模型可能没有参数化以完全捕获已知特征的影响，或者对于保守的站点，进化可能将已知因素组合成更优化的协同安排。

尽管保守位点和非保守位点的mRNA失稳程度不同，但就斜率而言，这两类位点的预测效果和观察效果之间的对应性无法区分。当只考虑非保守位点时，这种强烈的对应性缓解了人们的担忧，即我们的上下文特征可能仅仅指向保守位点，从而主要通过与保守位点相关的未知决定因素人为预测抑制。这种担忧与AU含量和UTR位置特征特别相关，因为这些特征与所有核苷酸保守相关，而不仅仅与匹配的miRNAs相关(补充讨论). siRNA脱靶的性能进一步缓解了这一担忧，这证明了该模型及其成分特征在没有受到任何靶向功效选择性压力的位点上都能很好地发挥作用(图6E和第5章). 此外，局部AU含量和UTR位置均得到了位点耗竭分析的支持，该分析也独立于保护，并具有与动物靶向功效有关的额外益处(图3D和和5C5摄氏度).

为了说明我们的模型在预测哪些站点更有可能调解压制方面的效用，我们研究了预测处于有利或不利环境中的单个站点对消息的破坏(图6G). 对于具有7mer-m8站点的消息，对于处于有利上下文中的站点，阵列上下调的消息的最小比例为0.49，与在不利上下文中观察到的0.09值相比，这是一个很大的差别。对其他类型的典型位点也观察到类似的区分。

为了进一步评估模型，我们构建了报告人，旨在测试单个7mer-m8 miR-25位点在模型预测的有利或不利环境中的疗效。miR-25不在阵列实验中使用的miRNAs中，它被用来确认模型扩展到了其他miRNAs，并在HEK293细胞中进行了分析，以确认模型扩展至除HeLa细胞以外的细胞类型。选择UTR时不考虑场地保护。回顾过去，正如预期的那样，在有利环境中保存了更多的位点（13个中有6个，而12个中有1个）。

几乎所有处于有利环境中的地点都产生了显著的压制(图6H)然而，在不利环境中没有一个位点产生可检测到的抑制(图6I). 重要的是，在预测为良好环境的7mer-m8位点中，报告分析中产生阻遏作用的分数大大超过了仅从表达阵列数据中得出的0.49值(图6G、6H). 有两个因素解释了这一观察结果。首先，由于阵列的测量噪声较大，因此低估了下调的消息数量。例如，在一个场景中，每个带有7mer站点的消息都被下调了15%，7mer表达分布将向左移动，但由于数组实验的噪音（如no-site分布的扩散所示），只有53%的站点被评为有效。第二个因素是阵列只监测mRNA的不稳定，而报告者的实验监测蛋白质输出。因此，在mRNA水平几乎没有变化或几乎没有变化的情况下，翻译抑制的消息将产生可检测到的抑制，而不是阵列。无论这两个因素的相对贡献如何，与用阵列在RNA水平上观察到的相比，用报告子在蛋白质水平上观察到的抑制程度更大，这表明我们研究中发现的上下文特征是一般的——它们成功地预测了在mRNA水平上介导抑制的位点和在蛋白质水平上介导抑制的位点。它们的普遍相关性是意料之中的，因为这些上下文特征得到了站点保护和损耗分析的支持，这是调节蛋白质输出的进化结果。

因为我们的方法寻找一般的上下文决定因素，所以我们不能排除仅在蛋白质水平上被抑制的靶点所特有的其他无关上下文决定因素的存在。然而，我们没有理由怀疑存在这种特定的决定因素。事实上，所有检测的位点都没有可检测的靶向性，预测这些位点将处于不利环境中(图6I)指出，如果存在这种特定于翻译抑制的未知决定因素，那么它们要么很少出现，要么影响可以忽略不计。

除了在有利和不利环境中网站之间的表现存在显著差异外，我们还观察到在环境分数无法区分的网站之间存在数量差异(图6H)，这表明我们的模型中尚未捕捉到报告读数的某些方面。这种无法解释的变异性可能导致在拟合阵列数据时观察到的皮尔逊相关r值较低（尽管显著）（例如。，图6D). 然而，阵列数据的可变性扩展到评分较差的部位，尽管如此，这些部位在报告分析中仍然是无效的(图6I)，表明阵列测量噪声或实际目标下游的影响是变异性的主要原因。因此，即使对于捕获了目标的所有可变性的改进模型，低r值也会持续存在。

特异性决定因素适用于内源性miRNA-信息相互作用

我们对体内miRNA靶向的进化效应进行了研究，从我们的保守性和耗竭性分析的结果来看，我们预计我们的模型不仅适用于外源性供应的miRNAs和siRNAs，还适用于内源性miRNA-信息相互作用(图2——6). 为了证实与体内靶向性的相关性，我们使用该模型预测了干扰三种miRNAs后对内源性信息的影响：斑马鱼胚胎中miR-430的敲除和拯救、成年小鼠肝脏中miR-122的抑制以及小鼠T细胞中miR-155的消融(Krutzfeldt等人，2005年;Giraldez等人，2006年;罗德里格斯等人，2007年). 在每种情况下，相关miRNA的单位点信息上下文分数与体内反应显著对应，从而证实了我们的模型对体内miRNA靶向的预测能力(图7A–D;对< 10⁻⁷对于每个面板，r分别=−0.26、0.27、−0.14、−.19，Pearson相关性）。此外，对于组合模型的每个成分特征，预测的对具有单个miR-155位点的信息的抑制与体内反应显著对应，从而证实了3'配对、局部AU含量和位点位置与小鼠内源性靶向的相关性(图7E-G). 这些数据也支持这样一种观点，即3'配对只对少数得分高的网站产生影响(图7E和5安).

在单独的窗口中打开

图7

内源性miRNA靶向模型及其组分特征的相关性

（A）斑马鱼内源性miR-430靶相互作用的上下文评分和体内疗效之间的对应关系。对包含6个、7个-A1、7个/m8或8个mer位点的消息进行分析，如图6F，使用已发布的数组数据(Giraldez等人，2006年)监测去除miR-430和其他miRNAs后内源性信息的稳定性。

（B）将miR-430恢复到缺失所有miRNAs的胚胎后，miR-430-靶相互作用的上下文评分与体内疗效的对应性(Giraldez等人，2006年)，分析如（A）所示。

（C）小鼠肝脏内源性miR-122靶相互作用的上下文评分和体内疗效之间的对应关系。使用已发布的数组数据，按（A）中的方式进行分析(Krutzfeldt等人，2005年)在抑制内源性miR-122后监测内源性信息的稳定性。

（D）小鼠T细胞内源性miR-155靶向相互作用的上下文评分和体内疗效之间的对应关系。使用已发布的数组数据，如（A）中所述进行分析(罗德里格斯等人，2007年)监测删除miR-155后内源性消息的稳定性。

（E）确认3'配对分数与内源性靶向疗效相关。对包含6个、7个-A1、7个/m8或8个mer位点的消息进行分析，如图6A，使用已发布的数组数据(罗德里格斯等人，2007年)监测删除miR-155后内源性T细胞信息的稳定性。为了使所有四种站点类型的数据都能被综合考虑，使用平均日志对值进行标准化₂每种场地类型的折叠变化。所有数据的线性回归（红线），如图6A，产生了显著的相关性(对=0.003，r=0.10，皮尔逊相关）。如siRNA转染数据集所述(图S5A)这个线性模型看起来太简单了，因为站点得分<3的消息没有明显的趋势（蓝色虚线），而少量站点得分高的消息（<3%的站点得分≥4）与强烈的去表达有关。仅对得分≥3（蓝线）的数据进行线性回归，得出显著相关性(对=0.004，Pearson相关）。

（F）证实局部AU含量与内源性靶向疗效相关。分析方法如（A）所示，但对站点进行了本地AU含量评分，如图6B(对< 10⁻³，r=0.12，皮尔逊相关）。

（G）确认位点位置与内源性靶向疗效相关。如（A）所述进行分析，除了位置得分外，如图6C(对< 10⁻⁴，r=−0.14，皮尔逊相关）。

机械影响

专一性机制至少可以从位点可及性和位点亲和力来解释，它们影响沉默复合体的结合和分离。例如，8mer、7mer和6mer位点的不同功效可能反映了结合亲和力的差异。种子区外的补充配对，特别是对miRNA的核苷酸13-16的配对，可以进一步降低结合沉默复合物的解离率。相反，局部AU上下文决定簇可能与位点附近较弱的mRNA二级结构有关，从而增加了对种子位点的可接近性。

多位点的增强抑制可以解释为任何一个位点被结合的可能性增加，或者同时具有多个沉默复合物结合的有益影响。我们观察到，两种不同miRNAs重叠或近重叠的位点产生的下调作用小于间距较大的位点，这有利于后一种可能性。同时结合多个沉默复合物的有益效果表明，与下游抑制机制的相互作用限制了抑制的数量或持续时间。这一发现表明，协同表达miRNAs的合作性延伸到不同位点，排除了协同作用的机制——局部集中效应，即第二个邻近位点仅重新捕获游离复合物。相反，最佳间隔位置的合作功能可以通过与抑制机制的合作接触来解释。或者，可以通过一个位点的结合增加另一位点的结合来解释，或者通过沉默复合物之间的良好接触，或者通过替换闭塞的mRNA结构。

额外的证据表明，为了实现抑制，miRNA位点必须保持结合，这来自于5'UTR和ORF中位点有效性的降低，这可能是由于核糖体从帽结合复合体转移到终止密码子时沉默复合体的置换所致。我们发现，这种效应超出了终止密码子，并延伸到3'UTR的前~15nt。~15nt的长度与mRNA进入解码位点下游~15nt核糖体的观察结果一致(Yusupova等人，2001年;Takyar等人，2005年)这可能会去除任何沉默复合物并阻止重新结合，直到核糖体与信息分离。核糖体对其整个翻译路径的明显干扰强烈表明，在miRNA控制下的信息在其抑制之前或同时至少经历了一轮完整的翻译，因此，不赞成在翻译全长蛋白质之前隔离相当一部分信息的模型。与天然miRNA位点相比，与人工siRNA完全互补的位点在ORF中功能良好，因此不受核糖体干扰。也许核糖体更难破坏更广泛的配对。此外，广泛配对的位点可能不需要保持关联，因为它们会导致催化裂解，而7-8聚体位点可能需要更长的关联时间才能产生明显的抑制。

位于长UTR末端附近的站点的效率提高可能归因于与翻译机器的接近或站点可访问性的增加。在mRNA的循环结构中，多聚（A）尾与5’帽相互作用，位于长3'UTR中间的位点距离翻译机制最远，而靠近ORF和5'UTR的位点可能更适合与翻译机制相互作用，从而诱导抑制。5'UTR或ORF内的邻近性更大，但这些位点将面临核糖体干扰，使3'UTR末端附近的位点成为最理想的位点。或者，如果长UTR被视为一团相互转换的结构，一端由核糖体结合，另一端由多聚a结合蛋白结合，那么UTR中间的区域将不太容易接近，因为它们有机会与两侧的片段形成闭塞相互作用，而靠近末端的残留物则不会。

局部AU含量的强烈影响是另一个上下文决定因素，表明闭塞UTR结构的作用。我们使用预测的本地二级结构和已发布的评估准则来对网站的可访问性进行评分，以跟踪这种可能性(Robins等人，2005年;Zhao等人，2005年;Long等人，2007年;Zhao等人，2007年). 方法Long等人（2007）尚无法进行大规模分析，但我们能够评估图6H使用STarMir(sfold.wadsworth.org网站)，它实现了此算法。在我们预测的13个最佳环境中，STarMir预测只有两个具有功能。在全基因组分析中实施Zhao等人的方法时，观察到下调与位点附近较弱的二级结构之间存在相关性，但二级结构预测的信息量小于局部AU含量，并且在考虑了局部AU成分后没有任何效用(图S3). 也许直接识别种子位点两侧的A’s和U’s是目标识别的一个组成部分，在这种情况下，对局部AU含量进行评分将比二级结构预测更可靠地衡量这种识别特征。或者可能是因为RNA结合蛋白、RNA三级结构以及任意RNA序列紧凑但多重竞争的构象(Schultes等人，2005年)细胞内UTR结构的细节与预测结构的细节有很大不同，因此对局部AU含量进行评分对于预测站点可访问性来说更为可靠。

鉴于我们分析中揭示的上下文特征反映了闭塞二级结构和核糖体干扰的负面影响，我们预计它们不仅适用于miRNA调控位点，也适用于一系列其他元素，包括调控蛋白的结合位点。例如，具有许多保守调控元件的消息将与更高的总体AU含量相关联，而选择性地避免任何针对其3’UTR的调控的消息将受益于GC含量的增加，这使得任何新出现的偶然位点不太可能发挥作用，从而有助于解释3'UTR中高核苷酸保守性和高全球AU组成之间的强烈相关性。同样，终止密码子15 nt内和长UTR中心附近的元素可及性较差，这可以解释为什么其他3'UTR区域具有较高的核苷酸保守性。

一种用于优先考虑保护地和预测功能性非保护地的资源

除了为机械模型提供见解和约束外，这里描述的上下文特征还为选择多种哺乳动物miRNA中的哪一种提供了有价值的信息：靶关系最有希望用于实验随访。因此，对于所有与已知miRNAs匹配的保守和非保守7-8分子位点，评估和报告每个决定因素(图S6;targetscan.org网站)目的是提供一种资源，使人们能够更快地理解这种最近受到重视的基因调控模式。

实验程序

微小核糖核酸和信使核糖核酸序列数据

根据miRNA核苷酸2-8，在人类、小鼠、大鼠、狗和斑马鱼中保守的microRNA被聚集成73个家族(表S1). 人类注释的5'UTR、ORF和3'UTR序列是从RefSeq获得的，小鼠、大鼠和狗的同源序列是从UCSC基因组浏览器multiZ多基因组比对获得的(布兰切特等人，2004年). 当多个RefSeq标识符映射到单个Entrez Gene条目时，使用UTR最长的RefSeq注释。

保护性分析

站点保护分析如所示Lewis等人（2005）此外，为了解释四个核苷酸在哺乳动物3'UTR中以不同速率保存的观察结果，控制序列也限于那些具有相同或几乎相同（在一个核苷酸内）组成的真实位点。每个miRNA的保守控制位点的数量通过除以人类3'UTR中的控制位点数量，再乘以人类3'UTR中miRNA位点的数量进行标准化。

阵列实验

用合成的miRNA双工体转染HeLa细胞(表S2)如前所述(Lim等人，2005年). 通过Entrez基因将探针映射到其代表性mRNA序列。只有在至少一半的实验中超过中等强度的探针才被考虑用于表达分析，这将分析局限于表达水平足以检测到下调的基因。当多个探针与单个基因匹配时，它们的几何平均值和最显著的对使用了值。对siRNA转染的阵列数据进行类似处理。

除非另有说明，否则只考虑同源miRNA的单位点信息。例如，在评估单个8mer位点时，只考虑UTR中只有一个8mer的基因，而不考虑额外的7mer或6mer。同样，当考虑单个6聚体时，排除了6聚体是典型7-8聚体的一部分的基因。多个站点的分析(图1C-1E、1J)和其他特异性决定因素(图2——7)以同样的方式进行，要求检测的模体的确切数量，而不需要其他标准位点，除了为了增加样本量而允许额外的6个单体，这是基于额外6个单体能在更强位点的背景下产生边际效应的观察结果。

计算下调基因的比例

为了确定每种类型的位点阵列上下调基因的最小比例，我们比较了带有该位点的消息与没有典型位点的消息的表达变化的累积分布，计算了两种分布之间的最大正累积差异。为了纠正累积分布中的颠簸，我们进行了100次排列，其中所有基因的下调值被随机洗牌，同时保持原始分布的大小，从实际分布获得的值中减去这100个控制排列的最大正偏差中值。

损耗分析

现场完工分析如所示Farh等人（2005年）但专注于组织和组织特异性miRNAs的子集，具有非常强大的耗尽特征，仅使用小鼠UTR数据。为了验证一种背景下的位点比另一种背景中的位点耗竭更多的假设，通过聚合表达同源miRNA的每个组织中靶基因的相对表达值（如图所示），在两种背景下对位点进行直接比较。

模拟来自双站点的压制

模拟的双面分布（绿线、，图1D-E)是通过从单个7mer位点分布中随机选择两个基因并将其对数相加得出的₂表达式更改。对于双面分布中的每个基因，此过程重复100次。为了与模拟分布进行比较，通过从双位点分布中随机选择一个基因和从非位点分布中任意选择一个遗传基因，并将其对数相加，修改了观察到的双位点分布₂表达变化（蓝线，图1D-E). 这种修改对于比较来说是必要的，因为通过对两个分布求和，结果分布的方差大大增加，因为微阵列测量噪声是复合的。还显示了单站点加上无站点和无站点加上没有站点的分布，以供比较。具有双位点的基因通常比具有一个或没有位点的基因具有更长的3'UTR；为了控制可能的长度效应，要求随机取样的成对基因的UTR长度彼此相差30%以内。

回归分析

对于每项分析，均使用皮尔逊（参数）和斯皮尔曼（非参数）相关检验确定显著性。报告了皮尔逊统计数据。除了图7E和5安，当使用这两个测试时，相关性的显著性没有实质性差异。3'配对得分与抑制的相关性(图7E和5安)使用Spearman测试并不显著，因为该测试对少数高分位点的影响不敏感。

报告者分析

检测结果与Farh等人（2005年），除了图1I其中25 nM miR-1和1 nM miR-133被联合转染。由于一种miRNA的共转染滴定了另一种miRNA的抑制，因此调整了相对miRNA浓度，使两者在结合时具有相似的活性。对于每个分析的构建物，将多个独立实验组合在一起，每个实验包含三个重复值。要组合独立实验的复制值，请使用firefly标准化雷尼利亚值被归一化为所有位点都被破坏的相同结构值的几何平均值。为每个构造绘制的值是归一化的几何平均值雷尼利亚同源miRNA转染的值除以非同源miRNA的转染值(图1G–I，，4C）。4厘米). 提供了构建和miRNA序列(表S3–S5). 使用HEK293细胞进行的检测完全相同，除了转染含有100 ng萤火虫对照报告基因、100 ng TK-雷尼利亚报告者，1µg pUC19和25 nM miRNA双链。

补充材料

补充

单击此处查看。^{（120万，pdf）}

致谢

我们感谢J.Schelter和P.Linsley为miR-133转染提供微阵列数据，并感谢Rosetta基因表达实验室为微阵列工作提供支持。NIH拨款（D.B.）和NIH博士后奖学金（A.G.）提供了支持。D.B.是HHMI调查员。

工具书类

巴特尔DP。微RNA：基因组学、生物发生、机制和功能。细胞。2004;116:281–297.[公共医学][谷歌学者]
Blanchette M、Kent WJ、Riemer C、Elnitski L、Smit AF、Roskin KM、Baertsch R、Rosenbloom K、Clawson H、Green ED等。用螺纹区块比对仪对多个基因组序列进行比对。基因组研究。2004;14:708–715. [PMC免费文章][公共医学][谷歌学者]
Brennecke J、Stark A、Russell RB、Cohen SM。微RNA目标识别原理。《公共科学图书馆·生物》。2005;三：e85。 [PMC免费文章][公共医学][谷歌学者]
Doench JG，Sharp PA。翻译抑制中微RNA靶点选择的特异性。基因发育。2004;18：504–511。 [PMC免费文章][公共医学][谷歌学者]
Farh KK、Grimson A、Jan C、Lewis BP、Johnston WK、Lim LP、Burge CB、Bartel DP。哺乳动物microRNA对mRNA抑制和进化的广泛影响。科学。2005;310:1817–1821.[公共医学][谷歌学者]
Giraldez AJ、Mishima Y、Rihel J、Grocock RJ、Van Dongen S、Inoue K、Enright AJ、Schier AF。斑马鱼MiR-430促进母体mRNAs的死基化和清除。科学。2006;312:75–79.[公共医学][谷歌学者]
John B、Enright AJ、Aravin A、Tuschl T、Sander C、Marks DS。人类微RNA靶点。《公共科学图书馆·生物》。2004;2：e363。 [PMC免费文章][公共医学][谷歌学者]
Johnston RJ，Hobert O。一种控制左/右神经元不对称的microRNA秀丽隐杆线虫.自然。2003;426:845–849.[公共医学][谷歌学者]
Krek A、Grun D、Poy MN、Wolf R、Rosenberg L、Epstein EJ、MacMenamin P、da Piedade I、Gunsalus KC、Stoffel M、Rajewsky N.组合微RNA靶预测。自然遗传学。2005;37:495–500.[公共医学][谷歌学者]
Krutzfeldt J、Rajewsky N、Braich R、Rajeev KG、Tuschl T、Manoharan M、Stoffel M。体内用“antagomirs”沉默微RNA。自然。2005;438:685–689.[公共医学][谷歌学者]
Lai EC、Tam B、Rubin GM果蝇属通过GY-box-、Brd-box-和K-box-类microRNAs截取靶基因。基因发育。2005;19:1067–1080. [PMC免费文章][公共医学][谷歌学者]
Lau NC、Lim LP、Weinstein EG、Bartel DP。一类丰富的微小RNA，可能在秀丽隐杆线虫.科学。2001;294:858–862.[公共医学][谷歌学者]
Lee RC、Feinbaum RL、Ambros V.The秀丽线虫异时性基因线-4编码具有反义互补性的小RNA第14行.细胞。1993;75:843–854.[公共医学][谷歌学者]
Lewis BP、Burge CB、Bartel DP。保守的种子配对，通常两侧有腺苷，表明数千人类基因是microRNA的靶标。细胞。2005;120：15–20。[公共医学][谷歌学者]
Lewis BP、Shih IH、Jones-Rhoades MW、Bartel DP、Burge CB。哺乳动物microRNA靶点的预测。细胞。2003;115:787–798.[公共医学][谷歌学者]
Lim LP、Lau NC、Garrett-Engele P、Grimson A、Schelt JM、Castle J、Bartel DP、Linsley PS、Johnson JM。微阵列分析表明，一些微RNA下调了大量靶mRNA。自然。2005;433:769–773.[公共医学][谷歌学者]
Long D，Lee R，Williams P，Chan CY，Ambros V，Ding Y.靶结构对microRNA功能的影响。自然结构分子生物学。2007年；14:287–294.[公共医学][谷歌学者]
Mathews DH、Sabina J、Zuker M、Turner DH。热力学参数的扩展序列依赖性提高了对RNA二级结构的预测。分子生物学杂志。1999;288:911–940.[公共医学][谷歌学者]
Miranda KC，Huynh T，Tay Y，Ang YS，Tam WL，Thomson AM，Lim B，Rigoutsos I.一种基于模式的方法，用于识别微RNA结合位点及其相应的异源双链。细胞。2006;126:1203–1217.[公共医学][谷歌学者]
Rehmsmeier M，Steffen P，Hochsmann M，Giegerich R.快速有效预测microRNA/靶标双链。RNA。2004;10:1507–1517. [PMC免费文章][公共医学][谷歌学者]
Reinhart BJ、Slack FJ、Basson M、Pasquinelli AE、Bettinger JC、Rougvie AE、Horvitz HR、Ruvkun G.21核苷酸let-7RNA调节发育时间秀丽隐杆线虫.自然。2000;403:901–906.[公共医学][谷歌学者]
Robins H，Li Y，Padgett RW。结合结构预测微RNA靶点。美国国家科学院院刊。2005;102:4006–4009. [PMC免费文章][公共医学][谷歌学者]
Robins H，出版社WH。人类microRNAs以功能不同的富含AT-rich 3'UTR基因群体为靶点。美国国家科学院院刊。2005;102:15557–15562. [PMC免费文章][公共医学][谷歌学者]
Rodriguez A、Vigorito E、Clare S、Warren MV、Couttet P、Soond DR、van Dongen S、Grocock RJ、Das PP、Miska EA、Vetrie D、Okkenhaug K、Enright AJ、Dougan G、Turner M、Bradley A.正常免疫功能对bic/microRNA-155的要求。科学。2007年；316:608–611. [PMC免费文章][公共医学][谷歌学者]
Saetrom P、Heale理学学士、Snove O，Jr、Aagaard L、Alluin J、Rossi JJ。微小RNA靶位点之间的距离限制决定了疗效和协同性。核酸研究。2007年；35:2333–2342. [PMC免费文章][公共医学][谷歌学者]
Schultes EA、Spasic A、Mohanty U、Bartel DP。随机生成的RNA序列的紧凑有序崩溃。自然结构分子生物学。2005;12:1130–1136.[公共医学][谷歌学者]
Takyar S，Hickerson RP，Noller HF.核糖体的mRNA解旋酶活性。细胞。2005;120:49–58.[公共医学][谷歌学者]
Wightman B，Ha I，Ruvkun G.异慢性基因的转录后调控第14行通过线-4调节时间模式的形成秀丽线虫.细胞。1993;75:855–862.[公共医学][谷歌学者]
Yekta S、Shih IH、Bartel DP。HOXB8 mRNA的微RNA定向切割。科学。2004;304：594–596。[公共医学][谷歌学者]
Yusupova GZ，Yusupov MM，Cate JH，Noller HF.信使RNA通过核糖体的途径。细胞。2001;106:233–241.[公共医学][谷歌学者]
Zhao Y，Samal E，Srivastava D.血清反应因子调节心肌发生过程中靶向Hand2的肌肉特异性微RNA。自然。2005;436：214–220。[公共医学][谷歌学者]
Zhao Y、Ransom JF、Li A、Vedantham V、von Drehle M、Muth AN、Tsuchihashi T、McManus MT、Schwartz RJ、Srivastava D。缺乏miRNA-1-2的小鼠心脏发生、心脏传导和细胞周期的失调。细胞。2007年；129:303–317.[公共医学][谷歌学者]