Science: 生物信息学,神秘的新职业
今天的生物信息学家迎来了好时候。由于各个部门生成了几乎无穷无尽的生物数据,因此形成了对于生物、统计学和计算机科学交叉领域中有经验的专业人才的高度需求。科学家如果能够分析大量信息并将其清晰地展示给决策制定者,就会发现自己的工作和职业生涯前途无量,尤其是在大型制药和生物技术部门。
“在大数据时代,这是个有趣的地方,也是令人激动的时刻。”罗斯—豪曼理工学院计算机和软件工程教授Sriram Mohan评价道,他就利用自己的学术假期在一家数据管理公司Avalon咨询公司研发生物信息学软件。 而且数据量如此之大,部分是由于思维方式已经从数据的生成转变为数据的分析,美国休斯敦市德克萨斯大学健康科学中心生物医学信息学系副教授W. Jim Zheng表示。现在,更简单划算的工具促生了更多的数据,因此就更需要有专家能够以一种方式理清堆积成山的信息,让其对科学家和临床医生具有意义,并最终惠及客户和患者。 产业界和学术圈对于生物信息学的认知上的转变,也促成了该领域工作机会的增长。先前,“科学家和公司往往会将生物信息学作为一种工具。”比利时根特大学生物信息学教授、MDxHealth公司首席科学家Wim Van Criekinge表示,MDxHealth公司研发基于实验胚胎学的癌症诊断。生物信息学家会被要求来解决一个关于数据的问题,他们的作用是在数据库中运行一个算法以获得答案。“但这门学科已经从像组织学一样的服务,进化成为了自己的研究领域生物信息学家现在是创新的马达。”他补充道。他们不仅解答了关于数据的咨询,更重要的是,他们决定了最初需要去问哪些问题。 因此,“当前,科学家有很多机会可以在生物技术、大型制药行业中寻找到生物信息学、大数据的工作。”猎头公司Klein Hersh国际的计算化学、生物和配方研发高级总监Jared Kaleck指出。 职业生涯在何方 为了定位工作岗位,认清职业生涯发展,需要理解生物信息学岗位的工作在不同的公司是如何组织安排的。在制药企业和大型生物技术公司,大数据科学家可能会发现自己处于三个不同类型的组织结构之一。其一,所有的大数据科学家和生物信息学家都在核心团队工作。这个大团队可以集中于研发或信息技术部门的工作,而且科学家在全公司各个项目的作用类似于顾问,有需要就会借走。 第二种模式中,生物信息学家的岗位是分散的,分布在不同的治疗领域。例如,在Johnson & Johnson公司(J&J),Patrick Ryan就负责带领流行病学分析小组。这位临床信息学家研发的分析诸如电子健康档案等“观测数据库”的统计方法,可以绘制出疾病模式,以更好地了解“我们药物的现实效果,发展安全协议并减轻对患者的风险”,他解释道。他的团队属于流行病学部门,向J&J的首席医疗官汇报工作。但是他也指出,公司也有强大的信息学和信息技术部门,其任务是“为如何管理和分析数据提供技术的视角。” 大型制药企业的第三种组织结构是前两者的结合。AstraZenica发现信息学全球总监Christian Reich分享道,他的公司目前正在沿用这种模式,尽管他也指出企业每过几年都会重新调整,采用其中的另一个模式。他的工作需要监督一个有25名专家的主要团队,但是其他信息学家分散在公司的各处。辉瑞公司也是如此,生物信息学家深入到治疗部门和核心的卓越中心,辉瑞研发业务技术高级主管Susan Stephens解释道。基因泰克公司也采用类似的综合模式,生物信息学高级主管Robert Gentleman解释道(他也是统计计算和图形编程语言R语言的共同发明者)。生物信息学家在组织的核心,但是他们“与不同的职能范围相结合”,他说,“他们在同一个部门,但是每天他们直接与疾病领域专家一同工作。” 大数据科学家在公司的工作任务根据其所在部门不同而有所变化。在研发部门,生物信息学家研究分析数据的新方法,帮助设计分析工具,甚至可能会在全公司科学家的帮助下构建分析工具,Reich表示。在此的理念是通过检验现有的开源算法并以新颖的方法进行应用,或是倚重数学和统计的专业知识来创建全新的算法。“目的是要组合出一个平台,让数据分析的工作更容易,并获得高质量的结果。”他补充道。 罗氏药物研究与早期开发中心全球业务主管(包括信息学)Bryn Roberts指出,在他公司混合式的结构中,信息学家和数据科学家参与到一系列广泛的活动中。他们研发并支持软件系统;他们找到外界的科学内容,并供全公司的科学家使用;他们落实并维护药物研发和管理职能的工作流系统,如实验室的线上笔记;他们支持并进行数据、图像和文本挖掘与分析,以支持科学决策的制定。 在基因泰克,生物信息学家参与到各个阶段的调查过程中,从参与设计实验以找到疾病的遗传标记,到利用他们的生物信息学技能以帮助找到有助于病患选择的生物标志物。 在大型制药企业的其他地方,大数据科学家可能会被派去调查疾病的趋势、药物开发和发现,这就会涉及到与营销团队的合作。他们可能也会为经营决定提供量化的支持,例如企业应该投资哪个疗法,印第安纳大学生命科学业务中心主任George Telthorst表示。 合同研究组织(CROs)也为对大数据感兴趣的人才提供了工作机会。就像全球最大的CROs之一——Covance公司信息学副总裁和首席数据科学家Dimitris Agrafiotis所表明的,“CROs正在逐渐成为制药行业的研发动力。”Covance数据科学家可以参与到整个药物研发过程的无数个项目当中,从生物标志物的发现到临床前研发、临床试验、健康经济学和效果研究,甚至是营销。 除了在大型制药或生物技术企业工作之外,该行业的支持企业也为数据科学家提供了工作机会,如生产生物信息学软件和其他数据分析工具的企业。除此之外,生物信息学家也可以在健康保险公司和医院管理组织中找到工作。 即便是学术界也看到了生物信息学工作机会的增长,该学科本身也在扩张。Zheng记得在基因组学早期发展时,大数据研究意味着科学家必须要离开高校实验室加入产业界,但是这种趋势已经变了。现在,像美国国立卫生研究院“大数据向知识转化(Big Data to Knowledge)”等计划已经开始为生物信息学的学术研究提供资金支持。 炼成大数据的技能 专家一致同意,最成功(以及获得工作)的生物信息学家都具有大量的技能,但出发点总是对生命科学知识的掌握,也称作该行业的“专业知识”。实际上,“你对生物学的理解越深,你越能在这个领域的工作中游刃有余。”Zheng表示。雇佣经理专门寻找在多个生命科学领域拥有博士学位的科学家,包括分子和细胞生物学、化学、遗传学、免疫学和流行病学。在基因泰克,Gentleman寻找的候选人应具有某种特定疾病的生物学专业知识。 除此之外,产业界的大数据工作也要求额外的关键技能,如文本挖掘、本体论、数据集成、机器学习和信息架构。Gentleman所称的优异的“量化能力”也是必需的,包括一系列的统计能力,以及包罗万象的计算能力。这些包括核心的编程能力,如C 或Java的编码,或PERL或Python的脚本编写,Van Criekinge表示。一个很重要的能力是能够控制操作系统如UNIX和Linux,并具备Hadoop和NoSQL数据库等常用工具的知识,Mohan补充道。如果能够具备数据可视化和建立有效用户界面的经验,以及对于硬件的熟悉度,则会增加你的“销路”。除了解决科学问题的能力,生物信息学家必须要精通业务。“生物信息学是团队作战。”礼来公司高级分析特聘研究员Stephen Ruberg表示,因此要求项目管理、团队建设和沟通的经验。实际上,“能够与其他科学家沟通才是我们最注重的技能。”Gentleman表示。 灵活度以及能够迅速适应也是至关重要的。“这是一个快节奏的环境。”Van Criekinge表示,“你必须要有不断使用新工具的心态,要不两年内你就要被淘汰了。” 搞定大数据的工作 最理想的情况是企业能够找到具备以上所有技能的应聘者,但是据消息来源表示,这只是一厢情愿。更多的情况是,录用决定取决于团队的实时需求,尤其是考虑到他们的交叉学科本质。“我们寻找的员工是能用自己的专业知识弥补现有团队的技能。”Roberts表示。然而,只是因为你缺少招聘海报中指出的某个具体才能或感兴趣领域,并不意味着你就不应该申请。“我们随时都会在内部共享简历。”Stephens表示。因此即便她不能让你加入她在辉瑞的团队,也可能会帮你找到该公司另一个适合你的团队。 在一些情况下,企业由于大量缺乏具有多技能的合格人才,因此在培养他们自己的人才。在罗氏,“我们提供各个领域持续的培训,并鼓励我们的员工参加会议、发表文章或者继续深造。”Roberts表示。辉瑞的数据科学家有无数的机会能够追求职业发展,同时公司也给员工时间尝试新的技术,Stephens表示,她将其称为“沙盒机会”。 经验在找工作之路上起到重要的作用。Kaleck极力推荐在产业界读博士后或进行实习,但如果二者皆无的话,科学家可以考虑“桥梁”计划,如数据科学人才培养计划(Insight Data Science Fellows Program)。这项完全受到支持的六周培训计划为博士后提供了在Facebook和微软等公司解决现实世界问题的机会。该计划吸引了拥有生物信息学博士学位的Vincent Fusaro。作为博士后,他拥有数据库、Python、机器学习和数据可视化等专业知识,这一点帮助了这个“数据忍者”获得了遗传信息公司Invitae的工作。今天,他负责软件工程、数据分析、流水线和产品研发等工作。 不断扩张的大数据 数据科学家可以期待这个领域在不久的将来会以新颖的方式进行转变和进化。但是底线是“企业在发展他们的生物信息学。”Kaleck表示,“生物信息学的工作机会与以往相比有100%的增长”,大多数是由于风险投资的增加所推动的。 鉴于大数据是“这个地球上最火的领域”,Agrafiotis表示,那些具备必要技能和专业知识的人通常有很多可选的机会。“我必须要与谷歌、亚马逊、LinkedIn和对冲基金竞争顶尖人才。他们在任何产业都很有价值。” 特别是,大数据在大型制药和生物技术领域的未来将是一片光明、激动人心的。“将你的专业知识带到卫生保健领域。”Telthorst表示,“你就会知道你会做出一番事业,不论是对于患者还是对社会。” 备注:Alaina G. Levine 是美国亚利桑那州图森市的科学作者。 参考文献: An Explosion Of Bioinformatics Careers 文献检索:10.1126/science.opms.r1400143 Big data is everywhere, and its influence and practical omnipresence across multiple industries will just continue to grow. For life scientists with expertise and an interest in bioinformatics, computer science, statistics, and related skill sets, the job outlook couldn’t be rosier. Big pharma, biotech, and software companies are clamoring to hire professionals with experience in bioinformatics and the identification, compilation, analysis, and visualization of huge amounts of biological and health care information. With the rapid development of new tools to make sense of life science research and outcomes, spurred by innovative research in bioinformatics itself, scientists who are entranced by data can pursue more career options than ever before.