本篇文章1268字,读完约3分钟
“大数据是数字生存时代的新战略资源,是推动创新的重要因素,并且正在改变人类的生产和生活方式。大数据来自政府、企业、网络和开源数据(每个人)。我们需要时间来研究大数据的科学问题,大数据应用程序问题也需要时间。”7月9日,发展中国家科学院院士、中国科学院虚拟经济与数据科学中心主任石勇在以“新金融规范、创新与发展”为主题的首届紫金峰会上发表讲话。此次峰会由浙江大学和泰然集团联合主办。
大数据面临的三大挑战
“十三五”规划纲要提出实施国家大数据战略。以大数据为基本战略资源,全面实施推动大数据发展行动,加快数据资源共享、开放和开发应用,帮助产业转型升级(爱心基金会、净值、信息)和社会治理创新。
“去年的大数据战略非常明确。一是完善收集和有效整合,深化政府数据和社会数据的关联分析和整合,统一共享交换平台,研究制定数据开放和保护等法律法规,完善大数据。产业链,加快关键技术研究,推动大数据软硬件产品发展。”石勇说道。
同时,他指出大数据仍然面临三大挑战:第一,在云存储和云计算的基础上,如何利用信息技术等手段有效处理非结构化和半结构化数据已经成为各国大数据专家的共识。共同关心的前沿科学研究问题;其次,如何探索大数据复杂性和不确定性特征的表征方法以及大数据的系统建模,这一问题的突破是实现大数据知识发现的前提和关键。再次,研究了数据异构和决策异构之间的关系对大数据知识发现和管理决策的影响。由于大数据本身的复杂性,这一问题无疑是一个重要的科学研究课题,对传统的数据挖掘理论和技术提出了新的挑战。
大数据时代的结论是不完整的
“大数据背后是‘数据科学’,而数据科学是一门关于数据收集、管理、转换、分析和应用的科学,其核心是从数据中学习和获取知识。许多人都读过《大数据时代》,但书中的三个结论并不完整。”石勇说道。
据了解,这本书提出大数据应该采样以及采样,大数据的采样比小数据的采样更普遍;大数据应该从粗糙中寻求准确性;大数据应该从相关关系中把握因果关系和必然关系。
对此,史勇表示,“大数据应该分析一切。我们能分组吗?这是反科学的。然而,在大数据到来之后,当数据量较大时,样本将会较大。寻求大数据粗糙度的准确性。大数据的主要原则在于预测,这是一种科学方法。”
此外,史勇还提到了大数据与财务决策的关系,以及大数据的应用。目前,中国大型商业银行和保险公司的数据量已经超过100tb,中国金融业已经形成了数据是重要资产的共识。中国金融业已经进入大数据时代的初级阶段,呈现快速发展势头。未来,金融业将围绕大数据启动新一轮it建设投资。
“卓越的数据分析能力是当今金融市场创新的关键。与资本管理、交易执行、安全和反欺诈相关的数据洞察已成为金融企业运营和发展的核心竞争力。”石勇说道。
关于大数据的应用,石勇说,“中国的个人信用评级系统是世界上第一的。”据报道,中国的个人信用信息系统基于8.5亿消费者的记录,服务于日常金融活动。截至2010年5月31日,个人信用信息系统的查询次数达到6.5亿次,实现了真正的基于大数据挖掘的金融工程理论与实践。
标题:石勇:《大数据时代》三个结论都不完整
地址:http://www.hztxyl.com/hzxw/8142.html