世界焦点!数字智能时代1:数据为什么能够产生智能?(数字智能的原理)
今天,我们来聊一聊现在非常火的一个概念,某某“数字化”。
本篇文章会 用 最 通俗的语言,最简单的模型, 讲清楚:
1.数字化 是什么意思?
【资料图】
2.数字化 的 原理是什么?为什么数据能够实现智能化,自动化?
3.数字化 和 某个行业领域 结合,促进其发展, 到底是怎么一回事?
放眼看一下四周:
企业,都喊着要数字化转型,
国家,也天天说 实现 xx数字化,帮助xx数字化,加速实现数字化。
网络上,各种文章铺天盖地 的 写着 数字化驱动xx发展,未来是数字化的时代,未来每个行业每个领域都要数字化。
还有,头几天 陆奇 在年度分享时 提到的 "第五范式"时代 和 各种数字化。
陆奇:曾任 雅虎、微软、百度总裁职位,现任 YC (Y Combinator:美国最牛x的创业孵化器机构) 中国区 创始人 以及 CEO。
(备注:创业孵化器 是 帮助创业者 提高创业成功率 的一种机构,会提供人脉资源,传授创业经验,帮创业者避雷,拉投资之类的。)
这么多人讨论数字化,那么一个问题就来了:
数字化 xx 到底是 什么意思?
数字化 xx 到底 是怎么玩的?
数字化为什么 就能 和各种 xx 结合,并促进其发展呢?
要想弄明白 数字化 为什么能够促进各行业领域的发展,
就必须得 理解 数字化 产生智能,实现智能 的原理,
只有弄明白了 原理, 才能 让我们 轻松地理解 数字化 如何应用?
下面我用一个最简单的模型来讲一下其中的原理,
并会举一些 实操的案例,这些案例的模型都是简化过的,能帮助我们理解就足够了。
这一切 要 从 一项技术的突破讲起,这个技术是:
机器学习 技术领域中 的 深度学习技术。
不论是任何的数字化 , 只要是数字化智能,底层用的都是 这个技术(深度学习)。
那么 接下来 让我们讲一下 深度学习技术 到底是干什么的?
深度学习技术 是如何 通过 数据的收集 和分析 实现 智能化的?
深度学习 技术 的本质 就是 实现 预测功能。
而我们能看见的 数字化 实现的各种效果 ,都是基于 预测功能实现的。
怎么理解预测功能呢?
举例:用自动驾驶 技术 来解释,我们的汽车 是如何实现自动驾驶功能的呢?
(以下用最简单的模型来说明)
比如说,汽车 前方 有一个障碍物,汽车是如何实现的自动转弯 避开障碍的呢?
首先,汽车 得 识别 出来,前面是有一个障碍物的,比如它用摄像头 拍到了 前面障碍物的图片。
此时,深度学习系统 会 通过接收的 图像数据(比如像素,颜色,像素排列) 来做个预测。
预测 挡在车前面 这个东西 是 个什么玩意?
当它 预测 到前方是一个障碍物的时候,它就会执行之前就绑定好的规则:拐弯。
深度学习 本质是 实现预测功能,而我们看到的自动化实际上是基于预测的结果绑定了一些行为规则。
这中间有一个 规则匹配 的过程。
那么,问题来了,深度学习技术是用什么方法实现的预测呢?
弄明白这个问题,我们就可以很好地理解 深度学习技术 是如何和各个领域进行结合的。
(下面会举一个 用在生物医学 如何研发新药 的例子)。
我们 把 深度学习 比作一个 加工盒,
也可以理解为一个加工函数:输入变化的参数产生对应的预测结果 -->输入数据到加工盒产生结果。
比如下面这个函数 : 预测结果 = 2x + 3y
( 其中 x 和 y 均为 实际收集到的数据参数,比如像素的颜色数值和大小数值)
深度学习 本质 就是 通过 大量的数据 来 打磨 这个 加工盒(加工函数)。
直到 把 这个加工盒 (加工函数) 打磨 到 预测准确率最高。
输入一条数据,深度学习 技术 会 微调一下 加工函数, 比如微调x的系数 :从2->2.5。
函数如下: 预测结果 = 2.5x + 3y
你输入的每条数据都 包括两部分, 一个是数据, 一个是你标明的这个数据的正确预测结果。
深度学习技术 会 根据 你新输入的数据正确结果 来微调 加工函数。
那么他是如何算出这个加工函数的呢?
他是按照什么规则微调的呢?
有时候我们会听到一个说法 : 深度学习 是一个 黑盒,意思是他能实现预测功能,但是不知道他里面是如何实现的。
这里换个说法就是: 我们能通过 深度学习 得到一个 做出很好预测 的 加工函数,但是我们不知道这个加工函数 是怎么算出来的。
(具体为不知道函数有几个变量,变量的系数是什么是怎么算出的)。
实际上 要用最简单的模型 来解释 他的运算过程,非常简洁:
就是:瞎蒙( 具体是穷举,有点像暴力破解密码)。
我们暴力破解密码 是怎么做的:
先试试:1, 错误, 再试试2 ,错误,再试试3,。。。 再试试123,。。。再试试123456。
挨个试,试到对为止,用穷举来说就是列出所有可能的排列组合,然后挨个试。
那么 深度学习 挨个试的是什么呢?
就是挨个所有函数,用穷举的方式一个一个试,
比如 : 2x+3y 试一把, 2.5x+3y试一把 , 3x+3y再试一把
每输入一个数据,深度学习技术 会根据 你给的正确预测结果微微的调整一下 函数公式。
具体 然后 通过不断地调整来穷举各种可能的 函数公式。
最终你输入了1000条数据,调整了1000次,结果你一看:
函数为: 预测结果 = 999x + 888y 。
把 像素颜色 代入 x 参数, 把像素大小 代入 y参数,得出的结果预测准确率最高。
但是,你是不知道 为什么x的系数 是999,y的系数是888,
具体到技术细节,卷积神经网络(一种深度学习算法) 里面 可能有 n个 参数,n个函数组合 。
你把实际上数据代入进去,就能算出预测结果,但是这个函数是穷举得来得,
加工函数有几个参数,参数的系数又是什么,完全是随机蒙出来的,没有任何可解释性。
这就是为什么大家都说 深度学习 技术是个 黑盒, 不知道怎么算出来的,
穷举蒙出来的,那当然不知道了,
那么到这里,我们再提出一个问题,什么因素 决定 这个加工函数 准不准呢?
其中最重要的就是 :算力,说白了就是计算机,
因为原理是穷举,所以你1台计算机 1个小时要是能穷举1000次的话,
那么10台计算机 1个小时就能穷举 10000次,那么当然是次数多的预测更准了。
谷歌就搞了个超级计算机,天天在尝试算乱七八糟的。
接下来 我来举一个 生物医学 研发新药的例子:
我们用最简化的模型来讲,肯定不准确,但是好理解。
比如说:我们在研发新药 是 什么流程呢?
药 本质上 由 不同的分子按照不同的结构组合而成的。
某些特定的分子组合结构 就 能和人的某种病(某种细胞受体) 产生关联,达到治疗的作用。
所以要想研制新药,就得 通过 尝试 各种分子组合 来实现。
而原来 ,没有深度学习技术的时候,我们大多数都是通过推测,实验来测试各种分子组合。
直到出现了深度学习技术,可以做预测了,就出现了一种新的玩法,
先把各种分子 作为数据 输入 到 计算机内,然后把各种分子 之间的化合反应,各种不同结构上的组合效果 输入进去,再把人的(某个细胞受体)信息输入进去。
然后我们就可以穷举各种组合方式,并且通过分子结合规则,能直接试出各种分子组合的效果。
结果就是用 计算机的深度学习技术 穷举 了 各种分子组合情况,得出了测试结果。
这样大大地提高了效率,因为计算器穷举的速度是比人挨个实验试要快很多的。
因为有了数量上和速度上的优势,试着试着就试出个有用的东西。
本篇文章先讲到此。。。
-
世界焦点!数字智能时代1:数据为什么能够产生智能?(数字智能的原理)
哔哩哔哩 2023-05-15
-
在哪里可以看同步的韩剧(哪里可以看同伊)
华南科技网 2023-05-14
-
国乒男队困境加剧,内战冲击大,马龙实力不容轻视|全球今头条
9点体育 2023-05-14
-
贵州一副镇长连续两次酒驾受查处,被降职为科员-今日讯
极目新闻 2023-05-14
-
中超-陈纯新传射建功 青岛海牛2-0梅州客家-精彩看点
央视网 2023-05-14
-
2023年5月14日山东省无水氯化钙价格最新行情预测 微头条
报告网 2023-05-14
-
Gen.Delight:决胜局最后一波团的沟通有问题,有Kanavi的JDG很强
电竞大事件esports 2023-05-14
-
首都中外家庭共迎国际家庭日
北京日报 2023-05-14
-
存漏油起火风险,法拉利在美召回425辆跑车
界面新闻 2023-05-14
-
美联储:资产负债表存在大量浮亏 美700多家银行面临风险
金融界 2023-05-14
-
世界焦点!数字智能时代1:数据为什么能够产生智能?(数字智能的原理)
哔哩哔哩 2023-05-15
-
在哪里可以看同步的韩剧(哪里可以看同伊)
华南科技网 2023-05-14
-
国乒男队困境加剧,内战冲击大,马龙实力不容轻视|全球今头条
9点体育 2023-05-14
-
贵州一副镇长连续两次酒驾受查处,被降职为科员-今日讯
极目新闻 2023-05-14
-
中超-陈纯新传射建功 青岛海牛2-0梅州客家-精彩看点
央视网 2023-05-14
-
2023年5月14日山东省无水氯化钙价格最新行情预测 微头条
报告网 2023-05-14
-
Gen.Delight:决胜局最后一波团的沟通有问题,有Kanavi的JDG很强
电竞大事件esports 2023-05-14
-
首都中外家庭共迎国际家庭日
北京日报 2023-05-14
-
存漏油起火风险,法拉利在美召回425辆跑车
界面新闻 2023-05-14
-
美联储:资产负债表存在大量浮亏 美700多家银行面临风险
金融界 2023-05-14
-
威迈斯产品均价逐年下滑,份额或被比亚迪、特斯拉“挤占” | IPO观察-焦点快播
第一财经资讯 2023-05-14
-
塔利斯卡于28日凌晨已抵达广州 环球播资讯
互联网 2023-05-14
-
天天热讯:多地明确!公积金可支付首付款
21世纪经济报道 2023-05-14
-
新视界|苏州虎丘:打造乡村型观护帮教基地 助涉罪未成年人回归社会
检察日报-检察新闻版 2023-05-14
-
环球热推荐:网贷挂账停息如何办理?网贷还不上怎么办?
金融啦 2023-05-14
-
一个月瘦20斤方法(一个月瘦20斤)
互联网 2023-05-14
-
全球新资讯:正割余割导数_正割余割
互联网 2023-05-14
-
保卫萝卜挑战23游戏狗_保卫萝卜挑战23
互联网 2023-05-14
-
太阳距离地球多远(一行星将以距地球最小距离飞过)
互联网 2023-05-13
-
海洋诗韵睫毛增长液_海洋诗韵
互联网 2023-05-13
-
即付宝app 即付宝安全_世界播资讯
城市网 2023-05-13
-
天天资讯:知恩于心更要感恩于行
科普时报 2023-05-13
-
环球热讯:飞马36 37 38 39哪个好_飞马3
互联网 2023-05-13
-
配股是什么意思是利好还是利空_配股 全球看点
互联网 2023-05-13
-
ROG冰刃7笔记本新配置上架:R9 7945HX+RTX 4070,19999元 当前要闻
IT之家 2023-05-13
-
地位远超iPhone!苹果Reality Pro头显12月大规模量产:售价超2万
快科技 2023-05-13
-
全球消息!百姓健康|关注慢性阻塞性肺疾病
上海杨浦 2023-05-13
-
发现汉代文字瓦当之美
人民日报 2023-05-13
-
天天看点:“上海太太月薪14万招保姆”,家政公司回应
红星新闻 2023-05-13
-
天天看热讯:各地精心组织防灾减灾宣传活动 增强全民防灾意识
南宁新闻网 2023-05-13