刘睿民畅谈大数据:政府应紧急设立首席数据官

网络新闻 2021-07-09 12:31www.168986.cn长沙seo优化

本报记者 商灏 北京报道

从IT到DT,技术的发展使人类真正有了预测未来的基础能力。中国数据分析技术的市场据预测将从2015年的45亿美元增长到2022年的368.6亿美元。在行业应用分布上,政府、银行、零售业是大数据分析市场最大的用户 。

在互联网和大数据时代,人类所有行为包括思想都会被记录下来并存储成数据,它是真实世界和虚拟世界之间的映射,构成了另一个世界,而且根据国家统计局信息,诺贝尔经济学奖获得者均有深厚统计学分析背景——即大数据分析背景。

数据是灵性和理性的结合,在当今世界海量数据是第一位资源,对于数据的发展和规划,反映出国家、行业和思想界的路径方法。从中央政府最近发布的《促进大数据发展行动纲要》来看,大数据的发展战略已被纳入到国家级和经济策略级的发展中,也被看做以市场作为资源配置的决定性因素,数据技术、产业发展必将促进中国从IT到DT的发展,加速中国经济转型的过程。

全球科技创新趋势正在发生巨变。大数据是人类社会的第一资源,对这一资源的有效利用和加工再生产,必将会对社会经济发展起到极大的推动作用,进而使人类可以更理性地分析世界、预知世界、应对未来,中国已经在大数据领域以后发优势的态势走到世界的前列,继续坚持下去,中国将会执世界经济发展之牛耳!那么大数据又将如何帮助改变企业、国家间的竞争格局?中国在基础领域及数据库研发领域最主要问题是什么?政策层面应如何加以引导解决这些问题?

《华夏时报》记者新近约请柏睿数据科技有限公司董事长兼CTO刘睿民接受专访,深入阐述相关问题。

曾任多家世界级跨国IT公司大中国区及亚太高管的柏睿数据公司创始人刘睿民,曾在国内上市公司华胜天成担任CTO,归国前在硅谷Tandem公司师从图灵奖大神级得主Jim Gray,共同参与过Tandem NonS SQL/MP的内核编写。据业界权威人士介绍,Tandem公司的MPP分布式数据库迄今为止依然在欧美的高端市场傲视群雄。

刘睿民认为,大数据时代的国家竞争发展优势,就是对海量数据进行分析,让数据变成对社会有价值的产品。目前中国虽初步具有这种能力,但空间还很巨大,因此刘睿民建议,政府决策部门应紧急设立首席数据官,这将有助于国家宏观战略决策中,各种数据不协调造成的应用管理中诸多问题获得解决。

大数据VS人与社会与国家

《华夏时报》:学术界有句话叫“透过数据看本质”,我们看到,包括您在内,当今海内外的学者正在以空前的热情投入用大数据研究和解决中国问题的事业中来,这一趋势所反映的本质是什么?

刘睿民:大数据产业其实是国家软实力的重要体现,记得我们从事大数据研究项目最早的一个案子,来自于传统制造业,时间大概在一年半以前。当时我们觉得很奇怪,制造业为何对大数据如此感兴趣?尽管那时大家都觉得制造业似乎在走下坡路,但制造业是真正的实业,由于其利润薄、生产效率相对较低,因此需要考虑如何从中国制造转向中国智造的产业转型问题。而所有产业转型都必须建立在对各类数据的精确管理上,数据最后会体现出产业增长和精细化管理的整体面貌。

从工厂管理到城市管理再到国家管理,都要靠数据来说话,都要根据数据所说的话来加以调整。比如国家统计局依据传统统计科学统计各种经济增长数据,如果与大数据管理方法结合起来,则其统计结果就能帮助人们更深入、更实时交互地了解或判断当前经济真实状况,甚至帮助人们预测未来的经济变化趋势。

再比如过去一向很保守的传统金融业,在遭受了互联网金融的刺激之后,其数据量开始变得很庞大,这引发了监管难题。尤其对于P2P,其所有交易都是多点对多点交易,监管难度很大。所以,一个需要清晰认识的问题是,如何通过数据管理这些经营活动?

在国家治理层面,决策者所看到的,可能是如何通过数据管理国家的问题。

透过数据看本质,我们所看到的都是从宏观到微观的一系列需要以数据来支持和帮助人们解决的问题。

《华夏时报》:大数据将如何改变人和社会的思维?改变企业、国家间的竞争格局?

刘睿民:上世纪90年代我在美国从事大数据研究工作,有机会接触到技术上通常比较超前的美国军方的一些项目,这包括无人自动驾驶技术、舆情监控技术、欺诈检测技术等。当互联网数据爆发之后,许多原先属于军用的技术渐渐变成了普通的民用技术,被运用于企业或国家间的经济发展竞争之中。最早出现的舆情监控技术,现在就已被许多地方政府普遍运用,并且下一步,舆情监控技术将会有进一步发展,变得可以引导舆情走向。较早被银行使用的欺诈检测技术,现在已经在制造业得到广泛使用。

数据可能会泄露,也可能会透过某种方式渗透进入网络中,可以通过排序、机器学习,通过人工干预的半监督学习、深度学习,拼凑出某种完整图景,以探索出并固定住某种经验。人类过去从没做到这一点。机器累积的这种认知能力,将大为提升人类使用知识的能力。

比如天气APP与地理APP的整合,就可能精确地告诉人类在某种天气形势下某些地区的某些状况会出现什么样的变化几率。这也就是说,过去靠人的经验判断的变化,今后可以由机器帮助人类做出更精确判断。这可能将从根本上改变人类的思维习惯。

《华夏时报》:如果大数据的核心就是预测,它能预测些什么?

刘睿民:所谓预测,正如刚才所言,只是将不同的人对一些特别环境的感受、判断等数字化之后,通过各种APP加以搜集并放入数据库,再进行检索、分类,以及监督学习算法、学习处理模板,和通过半监督学习对监督学习模板进行校正——大约就是这样的一种原理。但其所有的步骤都涉及到不同算法,比如排序、分类、聚类,以及深度学习算法等。这些算法在上世纪八十年代都已出现,但至今并未有突破性进展,并未发生质变,而只是量变,是在广度上发生了变化。不同维度上的数据量的增加,产生了不同的聚合,现在很多深度学习的算法与高性能计算中所用到的算法并无二致。而高性能计算中所用到的数据过去就已经很大。所不同的是,一个用在科研上,一个用在生活中。

大数据的预测,并非是指其能准确的看到未来,而是指其判断结果可能更接近实际值。

《华夏时报》:通过大数据管理有无可能看到竞争的对方将来的预定发展策略?

刘睿民:完全有这种可能。在算法不变的前提下,收集的竞争对手行为特征如果从10个扩大到10万个,且具备分析这10万个行为特征的计算能力,则分析的结果就可能很接近实际的情况。据此,就可做些推演,设想将会出现的变化,再根据算法做些调优,就确实有可能预料到对方所出的牌。但这更多只能算是一种推演,而不能算是预测。预测是按照某种路径推论,而推演则可能有若干个路径。但二者导致的结果都尚不具备唯一性。

Copyright © 2016-2025 www.168986.cn 狼蚁网络 版权所有 Power by