学术科研

王翊博士来校讲述如何整合利用生物信息数据开发在线工具

发布日期:2017-04-01 发表者: 浏览次数:

(图文|太阳集团成通讯员汪瑞敏)3月30日下午4时,加州大学伯克利分校助理教授王翊在太阳集团成逸夫楼C314分享了他开发生物信息学在线工具的心路历程。太阳集团成经理张红雨教授,党委书记李向东,李国亮、陈玲玲、马彬广等教授代表以及众多员工纷纷前来聆听。

王翊用他成功建立的PIECE(植物基因内含子和外显子进化数据库)和OrthoVenn(同源蛋白在线聚类分析平台)为例,详细介绍了开发生物信息学工具的完整流程。谈到PIECE数据库和OrthoVenn在线分析平台的区别,王翊说,数据库是将已开发好的数据包装成一个友好的界面展示给用户,而在线分析平台则需要用户提交数据,利用后台的计算再将得到的结果以可视化形式反馈给用户。两种不同功能工具的开发都需要经历需求分析(为什么要开发),阅读相应文献(在文献中获取数据来源,算法来源),撰写开发文档,编程、设计、测试,以及最后的发布整个过程。OrthoVenn的设计是基于2003年开发的OrthoMCL算法,用DIAMOND比对改进BLAST比对之后,算法速度提高了1万倍。王翊非常自豪的说:“我的网站每天有接近两百个用户提交数据,也经常有用户反馈说网站非常简单易操作,当然他们也写邮件给我提出一些建议。预计在接下来的两年里PIECE 3.0会发布。”

最后,王翊强调了3个开发过程中要注意的问题。首先是版本问题,要特别注意在开发过程中用到的软件版本以及在后期调试过程中版本升级等;其次是权限问题,因为服务器往往存在安全性隐患,服务器权限和用户权限不同,服务器权限非常严格,所以在设置权限的时候要特别注意区分和融合;最后也是最重要的一点,要多与潜在用户讨论,他们的需求敏感性更强烈,能提出更好的建议。

据悉,OrthoVenn从设计到最后发布只用了两个月时间,事实上这与过硬的工具开发能力和扎实的生物信息学背景密不可分。听完王翊的讲演,老师和同学们给予了一致好评,并与他进行了深入研讨。