2014年新春,大数据借助春运又火了一把。先是1月25日,中央电视台《晚间新闻》与百度合作,首次启用百度地图定位可视化大数据播报了国内春节人口迁徙情况,引发了巨大关注。第二天,国内首个运用大数据播报国内春节人口迁徙实况的网站“百度迁徙”上线,网友可以实时了解全国春运的最新动态,包括春运最热的线路、最热门的迁出城市和迁入城市等。
大数据是一种服务
未来,搜索引擎公司会发展成为大数据服务企业。中国工程院院士邬贺铨认为:“搜索引擎公司可以利用搜索以及各种方式获取大数据,服务于网民、社会和企业自身;另一方面,还可以提供大数据解决方案,帮助其他机构解决各种决策问题。”
要分析大数据,先要获得大数据。百度LBS(地理位置服务)技术总监顾维灏告诉记者,在百度LBS开放平台上,聚集了超过40万的开发者,为数十万款应用软件提供定位服务,已覆盖数亿部手机。“截至2013年12月,我国手机网民有5亿。通过分析手机网民定位信息的大数据,能够映射出人群的迁徙轨迹。”顾维灏说。
以百度地图为例,该应用每天接受35亿次位置请求。在定位服务方面,顾维灏和他的同事使用了很多专业的技术方法,如爬山法、概率分析法,最后发展到深度的机器学习方法,让定位的精度不断攀升。目前,他们的研究方向,是关于室内的定位方法。顾维灏表示,通过云计算平台数据处理,加上精准定位,“百度迁徙”能够实现全面、准确、即时反映人口迁徙状况。
在大数据中发现新闻点
百度品牌沟通部总监徐继业向记者介绍,今年春运成都往返北京的线路连续多日跻身全国十大热门线路。经分析发现,出现这种情况是因为越来越多的人从“过年回家看父母”变成“把父母接到大城市过年”,这样逆向迁徙成为春运新特征。徐继业认为,如果没有大数据提供的洞察,逆向迁徙这一新闻点很难被发掘出来。
借助大数据来做新闻,给人一种形象、精确、全面、科学、结构化的印象。中国人民大学舆论研究所所长、中国人民大学新闻学院副院长喻国明认为,上世纪60年代的精确新闻报道是经过结构化调查、民意测验等调查得到的,它的及时性和数据的全面性是不够的,而大数据本身就有及时性和全面性等特点,所以与传统的精确新闻报道相比,上了一个新台阶。
在喻国明看来,春运迁徙提供的大数据,为各级政府部门以后配置运力、科学化调配各种运输手段,进行各种防控,都是很好的数据支撑;对于社会学者和社会研究者来说,它更多的是规律性的发现和把握;对普通老百姓来说,通过这些数据分析,知道哪个地方热、哪个地方凉、哪个地方拥堵等,有利于更加合理安排自己的出行。“大数据给人们提供了多种可能性,未来很多社会的决策、社会的行为,包括商业的营销,都要建立在大数据分析的基础之上,这就是大数据的价值所在。”他表示。
“传统媒体相对于一些自媒体,它的优势在于可以做深入挖掘报道,传统媒体现在面临的情况是要做深入报道分析,需要重视和利用大数据,与其具有的公信力所结合,使得它具有更多的说服力。”清华大学党委宣传部部长、新闻中心主任向波涛认为,观众也会更喜欢数据新闻,因为新闻讲究真实,用数据说话的新闻是真实的。
大数据开发利用还刚刚起步
早在多年前,美国政府就利用搜索引擎公司的数据,分析国内地区性流感的发病趋势。在国内,越来越多的人开始关注大数据的实用性。“春节期间,央视结合百度大数据做的电视新闻中我比较关心的是热门线路排行榜,这个跟我个人生活更紧密。”国家行政学院新闻中心主任胡敏表示。在他看来,大数据的应用必将更加贴近老百姓的生活,比如全国两会就要召开了,利用大数据,媒体可以提前分析老百姓关心的问题,并作出针对性的报道。
其实,在百度迁徙正式上线之前,顾维灏和他的团队已经做了多次的尝试。“我们曾经做过地铁站的分析,以北京市海淀黄庄地铁站为例,我们得出定位的密度,定位的密度代表人群的密度,从而可以看出,该地铁站D出口基本上没有什么人走。”他表示,对这样的公共设施数据,他们也会分享给相关政府部门,给他们做参考。
此外,研究团队还做过对中关村商圈的分析和用户驾车导航轨迹的挖掘。通过顾客在商场里逛街的足迹,可以分析出哪些商铺是热门商铺,或者某一类人更喜欢去这家商铺,通过大数据的分析,可以优化线上和线下的交易。
徐继业认为,大数据的开发和利用,在中国还是起步的阶段。“去年,我们发布了热点图、查询艾滋病高发的区域等大数据,卫生部、中科院的教授都跟我们有接触,也在研究怎么利用我们的大数据帮助他们进行科研工作,帮助政府科学决策。”