写于 2018-11-10 03:10:01| 亚洲城老虎机| 经济指标
<p>想象一下,拿一千份电话簿,将它们一起粉碎,然后尝试使用重叠的部分来重建副本</p><p>与组装具有约30亿个“字母”的人类基因组相比,这是一个简单的问题</p><p>现在想象一下尝试将它们拼凑在台式计算机上</p><p>声音不可能</p><p> NICTA的Computational Genomics小组已经制作了一个名为Gossamer的新软件程序</p><p> DNA“字母”的序列是所有活细胞运作的指导书,理解它们对于促进我们对复杂疾病,特别是癌症的理解至关重要</p><p>过去几年,我们收集DNA序列信息的能力发生了革命</p><p>科学家可以花费数万美元和几周的时间收集人类基因组计划十年以上的数据,以及数十亿美元的资产 - 并且它一直在变得越来越便宜</p><p>这样做的技术,即所谓的“第二代测序”,产生数百万随机选择的DNA短片段,每个片段中有大约一百个字母</p><p>问题是这些测序机器没有给出关于各个片段如何组合在一起的线索</p><p>在某些情况下,我们可以将它们与参考序列(例如人类基因组)进行匹配,以便开始分析它们,但是对于许多重要的分析,我们需要尝试将它们拼凑在一起以重建原始序列:一个称为汇编的过程</p><p>对于细菌 - 它们的DNA中通常有几百万个字母 - 这个过程并不太难</p><p>对于人类 - 大约有30亿个字母 - 它要困难得多</p><p>有了Gossamer,我们肯定不是唯一为此目的构建软件的研究人员</p><p>确实有很多这样的程序,其中一些非常有效</p><p>但是,当涉及到组装复杂生物(例如人类)时,其他组装程序通常需要使用大型计算基础设施 - 超级计算机或大型计算机集群</p><p>这种基础架构的构建和维护成本很高,而且并不总是非常容易访问</p><p>这导致研究人员不收集数据,因为他们无法对其进行分析,或者他们使用具有显着缺点的循环方法</p><p>为了解决这个问题,我们深入研究了理论计算机科学“工具箱”,并提出了以下问题</p><p>解决装配问题所需的最小计算机内存量是多少</p><p>这是一个没有人问过的问题,答案令人惊讶</p><p>我们发现理论上的最小值完全在您可能在桌面上的好工作站计算机的容量范围内</p><p>使用最先进的研究,我们制作了一个用于组装DNA的程序,在某些情况下,它使用了流行替代品所需内存的千分之一</p><p>这项技术有几个好处</p><p>以前努力获得足够强大的计算机来分析其序列数据的科学家现在可以这样做了</p><p>现有超级计算机访问的科学家现在可以做更多的分析,也许能够研究更多的样本</p><p>在不久的将来,我们预计这种测序将从研究实验室转移到病理学领域</p><p>为了在经济上可行,病理学公司必须能够有效地分析序列数据</p><p> Gossamer是实现这种转变的技术之一</p><p> Gossamer的发展有两个重要原因:首先,它是一个有用的工具,可以帮助生物医学科学家增加他们对复杂疾病的理解</p><p>第二个更抽象的原因是,游丝表明理论很重要</p><p>如果没有大量的理论研究,

作者:漆庶昀