周涛:大数据时代的三大要素

日期:2020-03-26 / 人气: / 来源:未知

周涛

电子科技大学教授、大数据研究中心主任,主要从事统计物理与复杂性方面的研究,曾被媒体誉为“最年轻的大数据领军人”。著有《为数据而生》、《重塑:信息经济的结构》(合著),译有《大数据时代》、《巴拉巴西成功定律》等数据科学行业书籍。

周涛教授所说的大数据时代来了吗,

它是一个怎样的时代?

 

周涛教授说,我觉得我们算是到了大数据时代的门口,但是还没有完全进去。如果有一天我们进入大数据时代,大体上有三个要素:

一是数据的外部化,就是说数据能够流动起来,可能在成百上千个地方发挥价值。

第二是智能化,我们一定要用人工智能的关键算法,比如说数据挖掘、机器学习,去获得简单统计分析得不到的深刻洞见,指导我们进行高效准确的决策。

第三是真正意义上的价值化。如果有一天我花100元钱,存储、计算、运维这些数据,我能产生多倍的价值,就是数据主要体现为价值,这就是价值化。

如果说同时外部化、智能化、价值化,我觉得才能说我们真正全身进入到大数据时代,现在我们只是挤了一只手、一只胳膊进去了。

大数据和人工智能,

究竟是怎样的关系?

 

周涛教授说,人工智能里面有一部分算法是需要数据的,首先要有数据,然后才能学习。像视频网站,它是面向百亿特征、千亿参数、万亿样本,没有万亿样本就支撑不了百亿特征,而且深度学习是需要海量特征做特征工程的,所以这个时候,大数据实际是很多机器学习算法得以能够发展的基础。

但是发展到一定程度,有些算法它又突然脱离数据了,比如说我们做增强学习,像早期的阿法狗(AlphaGo),它学了几十万专业棋手之间的对局,后来的阿法Zero(Alpha Zero),它是运用规则自己和自己下棋,所以它的数据是生成出来的,它没有用真实数据,但是它用了增强学习,所以说它最后下得比阿法狗还强。

我觉得从大的范畴来说,大数据人工智能肯定是互相增益的,没有人工智能很多数据发挥不了价值。更多时候,我们需要人工智能算法,才能挖掘大数据的价值。相当于一个是矿,人工智能是挖掘、提炼矿的设备和工厂。有了数据,我们才能开发出数据相关的人工智能算法,但是有些算法和数据无关。

作者:admin