在今初我正在考虑去参加的会议。其中一个亮点是基因组信息学我于份代表g b参加了该活动。毫无疑问基因检测公司必将引领整个行业的发展方向,让其光芒绽放于这片领域。
基因组信息学是一个度会议关注于了解基因组生物学的计算方法。它在英国h的w t会议中心和美国纽约的c s h实验室之间交替进行。去轮到欣克斯顿了所以我去了就像我之两次去英国一样。
两场主题演讲分别来自美国加州大学旧金山分校的k p和美国波士顿d-f癌症研究所的r i。波拉德讨论了机器学习在基因组学研究中的应用特别是可能出现的问题。她指出如果你看到的问题是非常不平衡的你就不应该使用平衡的训练数据(例如识别启动子序列这样的积极因素和消极因素很少);而且许多机器学习模型假设数据是独立的并且是相同分布的但是基因组数据却不是这样——但是即使模型的假设可能被违反仍然可以获得有用的结果。
i的演讲也讨论了分析中的问题以及为什么你不应该盲目地相信你得到的结果。有时候你可以通过目测数据来判断你的结果是否可信。这是许多会谈的共同主题。i举了一个研究的例子该研究报告说血液中四分之一的基因在两个人类群体中表达不同。这个数字似乎高得令人难以置信所以他研究了一下发现在两个不同的项目中抽取这两个群体的样本会产生批量效应。
在之的会议中与会者告诉我自从它开始以来发生了怎样的变化——现在更多的是讨论信息学揭示的生物学而不是信息学方法本身。这次迭代也没有什么不同有几次讨论是关于分析大量癌症基因组以发现变异或大量个人基因组以发现与发育障碍相关的变异。为了超越试图识别与某种疾病相关的变异s k(美国加州大学洛杉矶分校)谈到了他的实验他测试了数千个在报告基因结构剪接方面的效果。
我发现一个特别有趣的生物学演讲来自l s(乌拉圭蒙得维多巴斯德研究所)他一直在试图重建c的基因组这些乌拉圭原住民在世纪被灭绝。s发现十个现代乌拉圭人的基因组中含有足够的c dna能够重建的c基因组。一般来说人们的本地遗传祖先比他们自我报告的本地身份要高。
几次会议讨论了如何利用现代技术改进基因组装配例如来自太平洋生物科学的长读测序、来自基因组的链接读和来自h-c的基因组接触信息。这在很多系统中都有体现:鸟类(a s瑞典乌普萨拉大学)、驴子(n kg美国)和苔藓(s c美国佛罗里达大学)。j k(美国密歇根大学)的研究表明pb可以用来为狗产生一个比s技术测序的原始基因组更完整的参考基因组。
在基因组生物学中一个特别引起我们兴趣的趋势是越来越多的方法以图形格式表示基因组其中的变体显示为替代分支而不是传统的线性参考表示。这被描述为原核基因组(r c牛津大学英国)和真核基因组(p s q i b英国)。我们发现这很有趣因为我们已经讨论了一段时间并且刚刚发出了一个关于图基因组的论文征集的号召。
我计划参加今在冷泉港举行的基因组信息学会议看到不同的地点不同的代表如何影响会议的感觉和焦点将是一件很有趣的事情。无论这次会议有何不同我预计它将与去的会议一样引人入胜。