8月3日上午,会议报告厅二楼会场,院士学者、商界人士依次上场,思维严谨、引经据典,引领大家在“数据海洋”里遨游。
阿里巴巴集团技术委员会王坚是这样理解的,“这得看大家怎么理解“数据”了,比如大家做科学实验时,自己设计,知道在干什么,这种非常“有目的”的收集,我认为叫“信息”,不能理解为现代意义上的“数据”。数据是在“不知不觉中得来的东西”,比如通过“北斗”计算不经意间得出地面沉降的分析,这就是数据。而这种“不知不觉”得来的信息离开互联网是无法实现的,所以,互联网变成了科学数据的基础设施。”
互联网不仅影响数据的产生,同时,对科研体系变革也有很大影响。以论文发表为例,涉及的一个主要环节是“同行评议”,那么,试想一下,如果没有互联网,论文只是在纸媒上的话,也实现不了公开讨论了,从这个角度讲,互联网了科研方法。王坚讲到。
另外,现在大多数论文都是只发表“结果”,不发表“数据”,论文只是作者对数据的理解,正确与否无法判断。当然,没有互联网的条件下,“数据”发表不可能实现,而现在“数据”发表的呼声越来越高,从这个角度讲,互联网也正在成为科研体系改变的推手。王坚说。
“大家到医院做CT、核磁共振等检查时,给到你手里的是两三张片子,医生研究的也是这两三张片子,但是,设备里可能存储了上千张片子,几千张片子留下来,却没有发挥作用,这就是一种浪费。”王坚以体检为例,向大家解释现实中“数据”面临的问题。
王坚说,以网页浏览为例,一个好的搜索引擎系统,背后是强大的“计算能力”。我国现在还没有能力索引世界上所有的网页,甚至都不知道全世界有多少网页,而全世界有90%以上的网页不是中文网页。问题还是出在“计算能力”上。
当然,对于“计算”的理解不能过于简单化,不要直接把“超算”归到“计算”范畴内,二者在编程、模型等方面都有很大不同。如果将“超算”看作是“把数据搬到计算所在的地方”,那么“计算”则是“把程序放到数据所在的地方”。王坚提到。
什么是数据分享的理想形式呢?王坚说,当大家可以通过互联网搜索到自己需要的“数据”时,数据分享也就实现了。而大家分享数据的是,“我的数据可以为别人创造价值”,而数据分享的实现还需一个过程。
以卫星云图为例,大家都可以通过公开渠道获得,但对于不同的人,价值就有很大差别了,美国某公司甚至可以通过卫星云图算出全世界某时刻的储油罐油量。王坚举例说明。
中国农业大学院士汪懋华在报告中也提到,大数据具有“5V”特性,分别是数据量巨大、形式多样、快速处理、数据真实、价值密度低等特性,同时也面临着数据复杂性、计算复杂性、系统复杂性等挑战。
“十三五”国民经济社会规划《纲要》提出要“加快推进农业现代化”,发展“智慧农业”作为“十三五”农业现代化重大工程之一,离不开大数据科学的支撑。
“精细农业”实践助推了“智慧农业”的创新发展。精细农业是基于农业水土资源与作物生在着明显的时间和空间分布差异性,在对差异性的信息管理基础上实施精细农作管理。而精细农作管理离不开大数据科学,离不开信息技术的发展,比如空间信息技术、信息、农业装备和作物信息科学发展都在农业中发挥了实际作用。汪院士说。
当然,“精细农业”实践中也面临一些挑战:较少关注成本节约和用户投入的经济效益分析研究、终端用户需要高新技术能解决农业生产经营提质增效问题等。
“我认为互联网、数据、计算的意义不亚于伽利略发明望远镜,不亚于生物学发明了显微镜。”王坚在报告最后说。
推荐: