自然科学的哪些领域将对大数据的发展和应用有影响

2020-05-17 科技 75阅读
现实世界中的事物是以数据的形式存储到网络空间(CYBER空间)中,数据被大量生产并储存到网络空间而形成数据资源。因而,需要探索网络空间数据奥秘的理论、方法和技术的一门新兴学科,即数据科学。
数据科学是未来发展方向,大数据是数字化生存时代的新型战略资源,是驱动创新的重要因素,正在改变人类的生产和生活方式。大数据是数据科学研究的一个方面,大数据的热潮促进了数据科学的发展。目前,数据科学研究受到越来越多的关注,近年来,有关数据科学的会议、期刊、论坛等也越来越多,世界各国纷纷成立数据科学研究机构,这些研究机构的成立推动了数据科学的快速发展。我国面临的问题不是要不要发展数据科学,而是如何开展数据科学研究工作,使得中国的数据科学研究处于世界领先地位。
2013年5月29~31日,主题为 “数据科学与大数据的科学原理及发展前景”香山科学会议第462次学术讨论会在北京召开。会议聘请中国科学院虚拟经济与数据科学研究中心石勇教授、复旦大学数据科学研究中心朱扬勇教授、伊利诺伊大学芝加哥分校Philips S. Yu教授和中国科学院政策所李建平研究员担任执行主席。来自国内外管理、计算机、数学、经济、生物、社会、法律等领域34个单位的46位专家学者应邀出席了本次会议。
石勇教授和徐宗本教授分别作了会议主题评述报告,会议还组织了11个专题报告。与会专家围绕“数据科学的基本问题、大数据挖掘、大数据环境下管理科学领域相关问题探讨及大数据与经济金融安全”四个中心议题进行了深入探讨。
一、数据科学与大数据的现状与展望
石勇教授作了题为“数据科学与大数据的现状与展望”的主题评述报告。他在报告中介绍了大数据的发展现状,提出“大数据”时代已经到来。全球对于大数据的探讨和研究已经开始,2012年3月,美国奥巴马政府宣布了“大数据研究和发展倡议”,投入两亿美元,要求几大科研机构合力研发大数据核心技术。在国内,中国科学院与复旦大学等国内机构于2007年开始先后成立了数据科学研究中心。2012年5月香山科学会议第424学术讨论会“网络数据科学与工程 ”、2013年1月中科院组织的“大数据背景下的计算机和经济发展高层论坛”等对大数据的研讨活动相继进行,希望能够推动大数据产、学、研的发展。
石勇教授探讨了大数据的定义——大数据是通过网络与非网络方式生成的形式多样,难于分析且含有高价值的海量数据集。同时指出大数据具有其明显的四个V特性,在此基础上,给出了大数据区别于传统数据集的两个基本特征:(1)分布式:大数据不一定储存于固定的数据库,而是普遍分布在不同地方的网络空间;(2)复杂性:大数据以半结构化或非结构化数据为主,具有较高的复杂性。
他还指出在大数据的研究过程中,有着许多数据科学相关的重要科学问题和研究过程要遵循的科学原则;探讨数据获取的公理存在性或一般科学定律;探讨封闭式数据存储与开源式数据存储如何影响知识发现的规律;探讨异构数据的不同表现形式之间的逻辑关系;从理论上系统地探讨已有数据挖掘方法的全局解及局部解存在性问题;探讨数据结构与决策结构在知识发现中的一般规律等。最后石勇教授给出了大数据产业的展望,例如将产业决策方式改变为“数据驱动的决策”,把传统的产业上升为数据决策的产业;以“跨行业数据挖掘过程标准”建立新型大数据产业;金融交易、网上交易可能成为第一波大数据产业等。
徐宗本教授作了题为“数据科学与大数据研究的科学问题”的主题评述报告。他提到数据科学和大数据的关系,即大数据是数据科学中很小的一个问题。在当前,为了理清数据科学的热点问题,需要关注大数据,要研究以数据为基础的方法论。他还描述了大数据的基本特征:不能集中存储、难以在可接受时间内分析处理和数据整体呈现高价值。他提到大数据的真正价值在于对国家和社会发展的重要性。此外,从研究机制上看,大数据是多学科交叉的综合性研究。所以,希望大家在发挥本学科优势的基础上,进行深度的合作和交流,促进大数据的研究。最后,他总结了大数据研究的若干科学问题,即高维、重采样、分布式计算、异构数据的信息融合和可视分析问题。
声明:你问我答网所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流。若您的权利被侵害,请联系fangmu6661024@163.com