世界焦点!数字智能时代1:数据为什么能够产生智能?(数字智能的原理)

今天,我们来聊一聊现在非常火的一个概念,某某“数字化”

本篇文章会 用 最 通俗的语言,最简单的模型, 讲清楚:

1.数字化 是什么意思?


【资料图】

2.数字化 的 原理是什么?为什么数据能够实现智能化,自动化?

3.数字化 和 某个行业领域 结合,促进其发展, 到底是怎么一回事?

放眼看一下四周:

企业,都喊着要数字化转型,

国家,也天天说 实现 xx数字化帮助xx数字化加速实现数字化

网络上,各种文章铺天盖地 的 写着 数字化驱动xx发展,未来是数字化的时代,未来每个行业每个领域都要数字化

还有,头几天 陆奇 在年度分享时 提到的 "第五范式"时代 和 各种数字化。

陆奇:曾任 雅虎、微软、百度总裁职位,现任 YC (Y Combinator:美国最牛x的创业孵化器机构) 中国区 创始人 以及 CEO。

(备注:创业孵化器 是 帮助创业者 提高创业成功率 的一种机构,会提供人脉资源,传授创业经验,帮创业者避雷,拉投资之类的。)

这么多人讨论数字化,那么一个问题就来了:

数字化 xx 到底是 什么意思?

数字化 xx 到底 是怎么玩的?

数字化为什么 就能 和各种 xx 结合,并促进其发展呢?

要想弄明白 数字化 为什么能够促进各行业领域的发展,

就必须得 理解 数字化 产生智能,实现智能 的原理,

只有弄明白了 原理, 才能 让我们 轻松地理解 数字化 如何应用?

下面我用一个最简单的模型来讲一下其中的原理,

并会举一些 实操的案例,这些案例的模型都是简化过的,能帮助我们理解就足够了。

这一切 要 从 一项技术的突破讲起,这个技术是:

机器学习 技术领域中 的 深度学习技术。

不论是任何的数字化 , 只要是数字化智能,底层用的都是 这个技术(深度学习)。

那么 接下来 让我们讲一下 深度学习技术 到底是干什么的?

深度学习技术 是如何 通过 数据的收集 和分析 实现 智能化的?

深度学习 技术 的本质 就是 实现 预测功能。

而我们能看见的 数字化 实现的各种效果 ,都是基于 预测功能实现的。

怎么理解预测功能呢?

举例:用自动驾驶 技术 来解释,我们的汽车 是如何实现自动驾驶功能的呢?

(以下用最简单的模型来说明)

比如说,汽车 前方 有一个障碍物,汽车是如何实现的自动转弯 避开障碍的呢?

首先,汽车 得 识别 出来,前面是有一个障碍物的,比如它用摄像头 拍到了 前面障碍物的图片。

此时,深度学习系统 会 通过接收的 图像数据(比如像素,颜色,像素排列) 来做个预测。

预测 挡在车前面 这个东西 是 个什么玩意?

当它 预测 到前方是一个障碍物的时候,它就会执行之前就绑定好的规则:拐弯。

深度学习 本质是 实现预测功能,而我们看到的自动化实际上是基于预测的结果绑定了一些行为规则。

这中间有一个 规则匹配 的过程。

那么,问题来了,深度学习技术是用什么方法实现的预测呢?

弄明白这个问题,我们就可以很好地理解 深度学习技术 是如何和各个领域进行结合的。

(下面会举一个 用在生物医学 如何研发新药 的例子)。

我们 把 深度学习 比作一个 加工盒,

也可以理解为一个加工函数:输入变化的参数产生对应的预测结果 -->输入数据到加工盒产生结果。

比如下面这个函数 : 预测结果 = 2x + 3y

( 其中 x 和 y 均为 实际收集到的数据参数,比如像素的颜色数值和大小数值)

深度学习 本质 就是 通过 大量的数据 来 打磨 这个 加工盒(加工函数)。

直到 把 这个加工盒 (加工函数) 打磨 到 预测准确率最高。

输入一条数据,深度学习 技术 会 微调一下 加工函数, 比如微调x的系数 :从2->2.5。

函数如下: 预测结果 = 2.5x + 3y

你输入的每条数据都 包括两部分, 一个是数据, 一个是你标明的这个数据的正确预测结果。

深度学习技术 会 根据 你新输入的数据正确结果 来微调 加工函数。

那么他是如何算出这个加工函数的呢?

他是按照什么规则微调的呢?

有时候我们会听到一个说法 : 深度学习 是一个 黑盒,意思是他能实现预测功能,但是不知道他里面是如何实现的。

这里换个说法就是: 我们能通过 深度学习 得到一个 做出很好预测 的 加工函数,但是我们不知道这个加工函数 是怎么算出来的。

(具体为不知道函数有几个变量,变量的系数是什么是怎么算出的)。

实际上 要用最简单的模型 来解释 他的运算过程,非常简洁:

就是:瞎蒙( 具体是穷举,有点像暴力破解密码)。

我们暴力破解密码 是怎么做的:

先试试:1, 错误, 再试试2 ,错误,再试试3,。。。 再试试123,。。。再试试123456。

挨个试,试到对为止,用穷举来说就是列出所有可能的排列组合,然后挨个试。

那么 深度学习 挨个试的是什么呢?

就是挨个所有函数,用穷举的方式一个一个试,

比如 : 2x+3y 试一把, 2.5x+3y试一把 , 3x+3y再试一把

每输入一个数据,深度学习技术 会根据 你给的正确预测结果微微的调整一下 函数公式。

具体 然后 通过不断地调整来穷举各种可能的 函数公式。

最终你输入了1000条数据,调整了1000次,结果你一看:

函数为: 预测结果 = 999x + 888y 。

把 像素颜色 代入 x 参数, 把像素大小 代入 y参数,得出的结果预测准确率最高。

但是,你是不知道 为什么x的系数 是999,y的系数是888,

具体到技术细节,卷积神经网络(一种深度学习算法) 里面 可能有 n个 参数,n个函数组合 。

你把实际上数据代入进去,就能算出预测结果,但是这个函数是穷举得来得,

加工函数有几个参数,参数的系数又是什么,完全是随机蒙出来的,没有任何可解释性。

这就是为什么大家都说 深度学习 技术是个 黑盒, 不知道怎么算出来的,

穷举蒙出来的,那当然不知道了,

那么到这里,我们再提出一个问题,什么因素 决定 这个加工函数 准不准呢?

其中最重要的就是 :算力,说白了就是计算机,

因为原理是穷举,所以你1台计算机 1个小时要是能穷举1000次的话,

那么10台计算机 1个小时就能穷举 10000次,那么当然是次数多的预测更准了。

谷歌就搞了个超级计算机,天天在尝试算乱七八糟的。

接下来 我来举一个 生物医学 研发新药的例子:

我们用最简化的模型来讲,肯定不准确,但是好理解。

比如说:我们在研发新药 是 什么流程呢?

药 本质上 由 不同的分子按照不同的结构组合而成的。

某些特定的分子组合结构 就 能和人的某种病(某种细胞受体) 产生关联,达到治疗的作用。

所以要想研制新药,就得 通过 尝试 各种分子组合 来实现。

而原来 ,没有深度学习技术的时候,我们大多数都是通过推测,实验来测试各种分子组合。

直到出现了深度学习技术,可以做预测了,就出现了一种新的玩法,

先把各种分子 作为数据 输入 到 计算机内,然后把各种分子 之间的化合反应,各种不同结构上的组合效果 输入进去,再把人的(某个细胞受体)信息输入进去。

然后我们就可以穷举各种组合方式,并且通过分子结合规则,能直接试出各种分子组合的效果。

结果就是用 计算机的深度学习技术 穷举 了 各种分子组合情况,得出了测试结果。

这样大大地提高了效率,因为计算器穷举的速度是比人挨个实验试要快很多的。

因为有了数量上和速度上的优势,试着试着就试出个有用的东西。

本篇文章先讲到此。。。