眼下最“红”的人工智能和大数据,让身边的一切都变得“聪明”起来,Siri会跟你聊天,汽车能实现无人驾驶,机器人也可以问诊看病。而真正让机器能与人类沟通对话的“幕后英雄”是知识图谱。
目前,天津大学数据科学与服务工程团队依托国家科技863计划、国家重点研发计划和国家科技重大专项,建立起一套大规模知识图谱管理与推理系统,平均能把推理效率提高3倍~16倍,其性能处于国际前列。
比起“红人”人工智能,知识图谱显得不那么为人所知,但事实上,人们每天都在使用它。当你打开搜索引擎,输入想要的信息,可能会检索出成千上万条相关信息,而到底哪个才是你真正需要的,这时候知识图谱技术就在发挥作用,它致力于让搜索结果更加有相关性和精准度。
事实上,海量数据本身并没有意义。有人把知识图谱形象地比作孩子玩的磁力棒,把一个个互不相干的知识,根据关联性连成一个“语义网络”,这对机器来说就是图谱。
在机器自动梳理出数据之间的关联、自动生成新的知识这个过程中,机器建立起了认识,能读懂和理解人类,也就是具有了跟人类一样的获取和形成知识的能力。简单说,知识图谱对于人工智能的价值就在于,让机器具备了认知能力。
“这是未来人工智能与传统产业融合的方向,也是未来人工智能走向应用的必经之路”,天津大学数据科学与服务团队成员张小旺副教授说,机器通过人工智能技术与用户的互动,从中获取数据,逐步构建和完善知识图谱,从而得以更好地认知和理解世界,服务于产业发展和改善人们的生活方式。
而如何获取、存储、管理与逻辑推理这些知识,提升效率和精准度,是科研工作者们不懈探索的方向。
张小旺介绍,基于当前大规模知识图谱存储体系,团队进一步研发出知识图谱科学管理系统,覆盖知识构建、存储、管理、学习与推理等知识图谱全生命周期的系统。
“在大数据时代下,数据规模的爆炸式增长与知识应用需求多样性、复杂性,对知识的管理提出了更高的需求。”张小旺介绍,面向未来的知识管理体系,必须要能够处理大规模、多领域、多模态、多任务的复杂事务。
该团队研发的系统平台能够支持10亿条知识管理与实时高效推理,其存储体系能同时支持HDD(硬盘驱动器)和SSD(固态硬盘)的混合存储,并拥有超过130T存储能力的大数据计算系统,“能为各种大数据应用,如精准医疗、智慧交通、健康养老等国民经济生活领域提供平台支撑”。
在这个平台可以开发出各种各样的应用,改变人们的生活。目前,该团队与中国人民解放军总医院正在合作研究面向精准医学的知识图谱管理、处理、推理与共享等全生命周期的基础理论与关键技术。这个基于人工智能的精准医疗项目,就是将千千万万个重症病人的基因和临床表现通过大数据关联并推理,帮助临床医生选定更恰当的治疗方案,也将帮助人们更好地预判和预防疾病。
同时,探索基于知识图谱技术的实时多目标识别、跟踪、分析、决策、规划等人工智能应用,团队与神州租车在无人驾驶领域应用展开合作。
张小旺说,这些合作都是应用知识图谱技术解决精准医学与智慧交通的核心问题,今后将不断探索大数据与人工智能在国民经济生活中关键领域的实践应用,用技术真正让人们的生活变得更美好。