加入收藏 | 设为首页 | 会员中心 | 我要投稿 财气旺网 - 财气网 (https://www.caiqiwang.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长学院 > MySql教程 > 正文

滴滴为啥值3600亿?看它的数据中台就知道了

发布时间:2019-12-23 09:58:48 所属栏目:MySql教程 来源:站长网
导读:副标题#e# 前年阿里开始讲数据中台业务,去年以来这个概念很火直到最近。我在阿里待了 10 年的时间,也参与了中台建设,今天想跟大家分享一下背后的逻辑,还有我在滴滴的实践,以及中台本质的问题是什么。 图片来自 Pexels 本文主要围绕如下几个部分展开:
副标题[/!--empirenews.page--]

前年阿里开始讲数据中台业务,去年以来这个概念很火直到最近。我在阿里待了 10 年的时间,也参与了中台建设,今天想跟大家分享一下背后的逻辑,还有我在滴滴的实践,以及中台本质的问题是什么。

滴滴为啥值3600亿?看它的数据中台就知道了

图片来自 Pexels

本文主要围绕如下几个部分展开:

滴滴数据中台发展

滴滴精益数据管理体系

滴滴数据系统组成

中台是买不来的

任何一个中台,不管是技术中台、AI 中台,本质上为了更好支撑业务,让业务能够更好的去把用户价值做出来。

从技术角度来讲创造价值的核心就是两点:

保证稳定且持续的研发生产,持续输出既有价值。

在生产过程中去找到可以改进的地方,找到新的创新点,创造更大的新价值。

滴滴数据中台发展

滴滴为啥值3600亿?看它的数据中台就知道了

看几组数据,这几组数据看起来挺大的,但目的不是为了吹牛逼,目的是为了讲这个东西。

其实滴滴也好,阿里巴巴也好,这些大公司数据都经历了四个阶段,每个阶段有不同的挑战,相信在座的同学不同公司也处于不同的阶段,或者说有可能也走到了这四个阶段的下一次循环。

业务发展驱动数据进化

滴滴为啥值3600亿?看它的数据中台就知道了

①业务信息化

其实滴滴很幸运,正好赶上了移动互联网那一波,把个人的位置信息进行信息化了,同时智能手机价格急剧下降,从四五千到几百块钱,任何一个群体都能买到智能手机,最大的核心变革是什么?

你的位置与状态随时随地都在线,这就是完成了第一个核心业务的信息化,滴滴赶上了这波一飞冲天。

②信息数据化

第二波当业务构建起来各个地方有数据被记录下来,如果 10 多年前有同学在做数据,当时肯定会去跟 DBA 吵,你这个数据量太大了,DBA 肯定会说:你删数据吧。

因为以前很多的数据是存在数据库里面的,而从 2006 年开始从记录事务本身到记录过程。

这个背后的核心是什么?背后是逻辑范式的变化,因为有了互联网。互联网之前所有的交流、互动其实是中心节点下面有很多小节点单独跟他沟通。

比如说我去和银行办业务,我去打电话给某一个人都是这样子的,最多一对 N,互相之间是没有别的互动,去银行办各种业务,顾客间是没有互动的。

但是有了互联网之后,所有的节点之间是可以被连通的,所有的节点是可以被连接的,所有的信息从记录的节点上变成了这个信息是记录到边上,这种范式变成了什么呢?

数据的量巨大膨胀,这个时候面临最大的问题是算不动存不了,包括我们在讲很多的实时计算也是一样的道理。

随着我们的业务发展、人是需要实时进行反馈,那就意味着实时计算需要的计算能力和存储能力变成更大的问题,当信息变成数据化之后一定会有这样的情况。

当有更多的数据被记录下来的时候,数据不再仅仅是 BI,意味着每个人开始去用数据,每个人用的数据很有可能自己产生的结果,同时是别人的输入。

这个时候就意味着一张公司里的数据网开始在编制起来,或者说最简单的数据链条在编制起来。

这个时候会出现很多扯皮的事情了,上游说自己解决自己问题,数据的问题是自己用的,为什么要给你用?

你依赖我的数据就依赖,出问题我不负责。被依赖很多上游说要改一个东西,下游说不能改,你改了,所有的代码也得改。

上游说不改怎么行呢,上面的业务要变。这个时候数据用的越多,扯皮事情就越来越多,为什么会扯皮呢?

不是大家有什么问题,而是公司里面没有数据的文化,我们核心判断这件事情谁对谁错的价值观,背后唯一判断标准是什么呢?

很多公司是没有的,因为数据越多,产生出来的各种扯皮就出现了。

③数据资产化

这样就到第三个阶段,每个地方都有大量的数据,每个业务都在消费大量的数据。

广告业务、运营、财务、现在还有越来越多的算法、人工智能,各个地方都在用数据,每个部门都有数据,每个部门都有自己的数据团队,这个时候开始烟囱林立。

有些时候数据在一个地方用的好,可能在别的地方用的不好。当年在阿里的时候,2012 年左右的时候最大的问题,怎么把消费者的数据打通。

因为不同的业务环节里面同一个消费者 ID 可能都不一样,到滴滴后来也面临同样的问题,快车、顺风车、出租车快速的发展,从来没有考虑过数据打通问题。

每个部门都觉得数据是自己的私产,我对这个数据质量保证只为自己负责。数据资产从公司角度来讲它是没有被盘点的,只在点上产生价值。

在滴滴我们是面临强监管的公司,可能在别的公司大家没有受到这么强的监管。

所以数据本身的安全合规对于我们讲是非常重要的事情,还好 2017 年加入到滴滴,对这件事情的重视程度比较高,第一个解决了隐私数据的处理,第二个数据分级管控,第三个数据的安全打标,还有关键的权限管理。

最近我跑的公司也比较多,发现做一些互联网金融类的公司内部的数据都没有做权限管理,这是非常恐怖的一件事情。

第三个一定得有对应的安全合规管控,这样公司才能走的长久,不然数据做的越大,很有可能就成为公司归零的大风险。

第三个是数据资产面临一个问题,可能这个资产在很久之前很多咨询公司会讲一个东西叫做数据治理。

包括像最近的 G20 各个政府的首脑也提到这个问题,数据越来越重要,数据需要流动起来才能产生价值,如果不把它标准化好,数据的价值是很难打通的。

但是我们可以发现很多的企业去做数据治理的时候,这个项目都是无疾而终,或者做了项目很好,但是用着用着这个数据又不行了,不得不过一段时间又提一个大项目劳民伤财去做这件事情,背后本质上的问题是什么呢?

为什么数据治理这件事情这么困难,投入这么大资金去做,但是产出却很少,而且数据是越治一会儿又难用了,能不能让这个数据越用越好用呢?我们发现背后还是一些本质上的东西去用的。

我们都在讲用大数据去赋能别人,大数据去做广告,大数据去赋能 AI,让 AI 更高效解决各种问题。

但我们有没有想过我们用数据能治理自己本身呢?这也是我们当时的思考。

我们重要核心问题在数据资产化这个阶段要解决两个问题:

数据质量混乱的问题。

高投入低产出问题,我好像做了标准化的事情,做了治理的事情,好像不太管用。

最后,当数据梳理通顺了,这个资产在公司里面流动起来,大概在 2018 年左右滴滴所有的数据在内部都是开放的。

当然是分等级的,需要走相应的合规申请流程,每一个人经过相应的安全申请都能获得所有的数据,相应的合规数据都能做查询、分析,甚至做研发。

④资产变现化

这样的情况我们作用到第四个阶段,怎么样把数据的价值最大化?怎么样变现?

现在我们来看一下主要三个方面:

一个是赋能人,让数据的门槛下降,让每一个人都能把数据用起来,这是我们背后非常难的理念。

在座各位很多都在做各种各样数据产品,有的是面向于工程师,有的面向分析师,但我们希望是整个数据平台体系能让公司所有的人在他需要的时候把数据用起来,把数据做到平民化。

第二个现在越来越多系统应用是数据密集型的,再往下一步走是数据智能化的,需要有算法、规则、数据来反馈这样的应用系统,数据必须把它服务化,去和前台的业务集成打通。

第三个滴滴是一个非常依赖数据的公司,后面我会讲为什么,绝大部分业务是靠算法来去驱动的。

所以算法需要的大量特征本质上就是来源于中台数据再次加工,怎么能够更好赋能 AI?这也是变现里面第三个难题。

(编辑:财气旺网 - 财气网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!