北拓资本百日谈 | 如何利用全网数据与AI技术赋能智能决策?

发布时间:2022-07-03作者:DataStory

如何将AI、大数据等技术与专业服务结合,构建从数据收集、治理、分析、建模到商业应用的全价值链解决方案,又如何来做好智能决策?


北拓资本「数字科技百日谈」,邀请数说故事创始人&CEO徐亚波博士,一起探讨这个话题。


以下内容为精彩片段节选

(点击此处或文末“阅读原文”获取更详细内容)


Q1


回望数说故事这七年,大致可以分为哪些阶段,这些阶段当中是怎么走过来的?


01

徐亚波博士:

创业的第一个阶段,也就是公司成立的前两年,第一,对我来说从技术上叫工程化,从商业上叫方向的抉择。 从学术上可能算法上比较领先,但是把算法工程化还是需要很多时间的。我们用这两年时间完成了工程化加方向选择。数据是人类的一个生产要素,或者说它是一个更底层的要素,好的算法没有数据的“喂养”也无法成为好的算法。所以我们从基础设施角度来说,预先做了Data这件事情。


第二,商业场景的选择。我记得前两年我们也是服务各种各样的客户,我们在两个方向之间做了一个选择。一个方向是DMP,可以理解为把数据汇总到一起,然后在上面推动营销的投放。还有一个是依托数据做分析类的场景,我们称之为商业分析场景。


2016-2018年对我们来说叫标杆项目阶段和产品化阶段,以及行业和应用场景阶段,这个阶段又奠定了我们公司另外一个核心。当时很多行业都要用到数据和场景,我们选谁和不选谁?我们后来先选择了消费品这个大赛道切入。因为我们认为消费品几乎是一个永恒的行业,老百姓始终要吃穿住行。


二是我们优先选择了大客户,因为从中国的大企业中吸收经验更有利于我们当时的快速积累。又因我们做的是数据,数据这个东西本质上它还是一个“奢侈品”,只有这个公司有一定的体量,有大量的数据才能用数据治理好它,或者是产生更客观的效益。所以无论是客户需求还是付费能力上,在2016-2018年,基本上确定了我们早期的KA模式。


除了服务客户以外,回归本质我们是一家技术和产品型的公司,所以2016-2018年始终在解决产品和项目之间的关系问题,最后找到一个解决方案,本质上只能通过我们的PaaS平台来解决,就是你要把交付能力、基础设施做好,然后在上面可以应付多场景或者是灵活多边的交付。所以我们又是在业内比较早的意识到PaaS平台是SaaS公司的选择模式之一的公司。再加上我们的技术基因很强,所以我们从2016-2018年完成了各种标杆客户加一定的产品化,就开始进入到第三个阶段,也就是开始做基础设施。


从2018-2021年,这是我们的第三个阶段,PaaS平台做出来了。从此之后,我们做产品就开始不仅做单一应用场景,开始做多元应用场景。因为我们有能力做多元应用场景了,更进一步反向促成了我们数据的多元化,那个时候我们从线上数据开始走到了线下数据。到了2021年,从气质上在国内没有那么完全对标的公司。


数说故事是一家什么样的公司呢?是一家把数据从收集或者是合作,然后到处理、建模、可视化、构建应用、交付客户,整个产业链是非常完整的。


四是阶段,是做成一个平台模式,一端不停增加数据源,一端不停增加应用。客户因为你的应用越来越多,黏性越来越强,客单价越来越高,然后也能帮助他完成一体化的连续的解决方案能力。所以我们从2021年开始,进入了一个新的平台阶段,我们称之为“飞轮模式”。


大概是分为这四个阶段:一是方向选择和工程化;二是标杆加产品化;三是基础设施,是PaaS平台加丰富的场景;四是平台加生态阶段。



Q2


从甲方的视角或者是乙方的视角分别讲一下对数字化的理解?


02

徐亚波博士:

我非常愿意谈和客户有关的事,这也是我主要的关注点。我自己有一个很大的看法,整个中国社会在过去这些年里,在软件产业或者SaaS产业发展并没有那么健康,那从甲方、乙方视角究竟他们需要什么,为什么没有被满足?


从甲方视角来看,从早期来说他是希望做数字化,解决方案或者是RFP这些东西。一提可能我做数字化三年需要5000万,一年投一千多万,传统上是这种大项目模式,甲方在做这件事情的时候决策是很艰难的,而且选错一个供应商的代价是很大的。从甲方角度来说,他很希望把数字化这件事给分成一个个小阶段,一个个小场景,最好花一分钱就可以见效一块的,这是所有甲方老板给我们提的诉求。


从乙方来看,就会把他的大生意分成一个个小生意,那么这些小生意是不是都是自己的?作为一个公司拿到一个小生意之后,能不能做到足够规模化,在单个小生意上能不能赚到钱,这就会形成很大的问题。


这就是中国过去那么多年来,很多SaaS公司刚开始拿到了很多钱之后做的事情,也就是说他不想做老模式,他想做产品化,做产品化他就希望卖更多客户去完成他的积累,或者完成赚钱。但是当他卖更多客户就会陷入到一个误区,就是我只能卖SMB,或者说更多的客户覆盖,大客户头部就是那么多。


其实我觉得甲方和乙方之前是有一个错配的,这是我看到在中国这个行业里最大的一个差异点。其实我的思考很简单,你做生意就是要共赢思维。我总结一句话,要用甲方的逻辑去思考需求,要用乙方的思维模式提供产品和服务。


当然这个中间要把投资人的因素尽量的抛开,什么逻辑呢?你永远是特别细心的去研究在甲方的需求怎么能拆成100个场景,我自己的研究,弄清楚每一个场景怎么去解决,这是从甲方的思路入手的。


从乙方的角度,规模化是分为两种的,一种是纵向的重用,一种是横向的重用。在中国,横向的重用由于整个企业这一块的基础没有那么好,其实他可选的赛道是很少的,或者说只有少数的SaaS公司可以非常幸运的找到一个赛道,他在横向扩张非常有效。但是如果你纵向扩展的时候,其实你的优势是很明显的。第一个是你的客户质量很好,你只要选少数的或者是相对少的客户。第二个是销售成本很低,你的LTV/CAC肯定是很高的,它唯一挑战的是什么?唯一挑战的是这家公司的纵向复用度是多高,这是很本质的东西。


所谓的纵向复用度是你到底用同一个技术能不能做出多个场景来,同一份数据能不能做出多个场景来,你在平台算法这一层能不能复用,其实这就是我刚刚讲的PaaS的思维。


接下来我来讲讲数说故事是怎么来完成这个东西的?举例来说,我们还是从原点思考的,比如说我去看任何一家消费品企业什么对它最重要?我认为最重要的事情是要拥有一个好产品,好的产品是后续营销和渠道铺设的垫脚石,当时我们就瞄上了产品创新这个场景,但是在企业内,产品创新场景是非常复杂的。


在战略阶段,他可能决定要不要进入这个赛道,这个时候他会对赛道进行研究。他可能再会到具体赛道里面研究竞品,研究完竞品之后,会到具体赛道里选择要用什么颜色、什么原料、什么包装、什么创新之类的。类似的可拆解为三四个场景APP。这时决策因素就缩小了,我们就会一直往下延伸,其实我们现在已经做到了工业创新环节,也就是说他最后要买原料,我们就把全国的可行的供应商给选出来。这个过程越来越像产业互联网了。其实你只要沿着客户需求不断深挖,在纵向上你会越做越深,纵向上越做越深,同一个纵向里面的很多数据源、技术这些东西都是同一个逻辑。


举一个例子,当我们进入线下的时候,我们还服务了大量的门店客户,因为我们有很多线下数据。当我们进入这个行业的时候,我们看到一批做选址的公司,就是大概卖几千块钱一个月,一两万一年这种类型的,这就是我说的横向战略,就是通过覆盖更多来盈利。


但是我们的逻辑不是这样的,我们的逻辑是说,我们把选址往上去看,他其实是一个开店需求,开店的需求是扩张的需求。也就是说老板要回答的第一个问题是,明年的战略我到底要做多大扩张,到底增量是50%还是100%,应该在哪些城市。这个时候他就会从战略层面先用数据,然后再到逐步的选址,然后再到门店运营,到门店运营就会有选址和促销,它又被分成很多小的场景,我一步一步解决他的需求。


在做生意或者是从甲方、乙方这些数字化的视角来看,数说故事致力于提供轻量级、连续性的解决方案他的形态就是APP的“集合店”。我们可以让老板不用一下子花那么多钱,然后一步一步,一个一个的解决他各个场景遇到的问题。


Q3


现在最主要的是哪些类别的数据?未来想进一步扩充的有哪些数据类型?


03

徐亚波博士:

其实全网络数据这个概念并不精确,未来我们会叫OpenData,对我们来说,为什么不叫全网数据?因为有一些数据不是在网上的,它有可能是在线下的,但是是相对公开的。所以我们自己对数据的布局是这样的,我们最早前面的两三年,我们专注于线上数据,包括社交媒体的数据、电商数据、新闻、垂直网站数据。我们在前两年,三四年基本上把这个数据积累完成了,形成了一整套的数据合作和采集的逻辑。


第二,我们很快看到线下,因为你只做线上生意是不够的,因为中国还有70%-80%的数据在线下,这个时候线下数据系统化的收集、合作对你来说就比较重要,所以我们和各种各样的合作伙伴开始系统化研究线下数据,包括人、货、场的数据,如何把这些数据综合到一个体系当中,形成一套数据标准,这个是线下数据。


最近一两年,我们开始把目光放到海外,也就是说线上、线下我们都已经有布局了,再接下来海外数据就比较重要,因为帮助中国品牌出海也是我们非常重要的使命之一,所以最近一两年我们开始重视积累海外数据,包括TikTok、Lazada,包括电商的数据和独立站的数据,这些数据都是我们比较系统化的积累的,现在已经初具雏形了。


还有线上线下都是比较偏营销类的数据,或者说跟营销是更相关的,我们正在进一步做产业的数据,比如说在一个产业链,他的上下游是什么关系,就是B2B的数据,这也是我们新的大方向。


线上、线下、国内、海外,从营销类到更深的产业类数据,这是我们非常大的一个布局。


Q4


数说故事已经有一定规模和体量了,有很多合规性的措施去规避这些风险,和大家分享一下经验?


04

徐亚波博士:

首先从价值观角度去分享一下,我一点不觉得这个问题敏感,我也非常愿意公开的和大家一起探讨这个问题。我做数据这么多年,其实从国家政策上来讲,国家鼓励数字经济,国家一再提要把数据要素作为数字经济核心要素发挥出来。所以从国家层面来看,肯定是鼓励大家更好利用数据的。


我觉得最关键的是大家要把握一点,一定要做社会和商业生态正向有价值的事,我觉得这是一个价值观层面的事,也就是说不管你从事数据的什么方面,我始终秉持这个观点。这是为什么2015年开始做数据,后来一批做数据的公司,很多做金融向的公司把它用到P2P、催款、电话营销等等方面,我们公司从来没有做过这样的事,我们始终有一个价值观是要做对社会和商业生态有价值的事,我认为做数据的公司,首先要秉持这一点。


第二,业务层面我们一直坚持做OpenData,不做个人数据。我们为什么叫OpenData,OpenData是说这个数据是愿意被公开或者是被授权公开的,这是我们的逻辑,我们的数据更像是商业界的统计局这一类的数据。我们更多专注于行业的分析、区域分析、群体分析、趋势分析方面。我觉得中国的隐私保护法,包括欧洲的GDPR已经基本上把这个问题说清楚了,你不能在个人数据上做深挖,因为个人数据很难被公开授权的。所以从业务选择上,你要尽量把业务划清楚。


第三,数据合规需要经过长期的合规体系建设,包括这两年来,我们一直开始逐步跟很多政府合作得非常紧密,包括现在省国资、市国资等,你要跟监管部门保持比较紧密的沟通,去理解到底什么能做,什么不能做,你要主动被监管,你只要做好这件事。而这个时候,政府的视角也欢迎你这样的公司,尤其是头部公司主动接受监管,并且一起探讨如何更加合理的利用数据要素去发展经济同时不要破坏合规性,你就成为了这个合规的贡献方。


第四,在技术层面,我们还是要做好数据的安全工作,在技术的体系、数据安全合规层面,在技术层面要做好这件事。比如说原始数据从来不外流,坚决在别人访问的时候,只能拿到数据分析结果,不能接触到这些最原始的数据。


我觉得基本上只要在价值观、业务、监管和被监管的关系处理好,再到技术,我觉得哪一个社会都会鼓励这样的公司。


Q5


基于现在的产品,AI技术在哪些场景里有落地?


05

徐亚波博士:

你的问题有一点和我的理念是完全一致的。当然我们这个行业天然就是要用AI的,因为我们处理了大量的数据。你在这个数据里面做很多分析的时候,你不用到AI技术是解决不了的。我们主要是在四个方面致力于在技术上一直做到领先,或者不停在研究。


第一,我们现在花了很多时间在做模态技术,现在仅仅是做文本分析已经不够了,现在相当多的内容在用视频做表达,显然你要有能力能够同时把文本、视频、图像各种各样的形态的数据给综合在一起,然后用机器学习训练去分析它的逻辑、意图、类别。所以首先是多模态技术,最早我们做NLP做得比较多,现在已经进展到多模态这个层次,花很多时间在做这个事。


第二,像我们这个公司本质上还是做商业的分析、预测这些类型的大方向,在这个过程当中,人类的知识怎么被融合进来,这是我们一个非常大的要解决的问题,其实就是知识图谱。我们所做的很多工作就是从大量的数据里面去构建这个商业的知识图谱,我们应该是国内最大的一家做开放式商业图谱的之一。我们有几千万的节点,就是这个机器的脑子里装了什么样的商业知识,这是我们一直在构建的。同时怎么和行业的Knowhow结合起来做,这是我们花很多时间在做的一个事情。


第三,当你能够分析多模态的数据了,也有了一定的机器行业Knowhow,这个时候你要做趋势的分析和预测,其实本质上就是做预测了,你要预测哪一个产品能火,哪一个KOL性价比比较高,这里面涉及到大量的预测模型,这里面也是和行业Knowhow和机器学习技术结合起来做的。


第四,内容生成,这是我们最近在做的,也是非常看好的。相当于你做了那么多分析之后,越来越多的客户会挑战我们一个问题,你觉得这个东西会火,能不能做自动生成呢?相当于你开始做了干预层,内容自动生成这是我们最近在做的了。在虚拟人、文本创作、短视频创作方面,我们也在联合一些生态合作伙伴做各种各样的尝试和试探,本质上是想把洞察到策略到行动的闭环给完成,这是我们在AI上做的事情。


另外我们公司在做AI的时候还有一个特点,作为一个学校出身的人,我自己有一个很大的看法,之前业界有很多的讨论,到底应不应该把学校教授挖到工业界去做这个事。我觉得我特别在这个地方呼吁一下,我们要构建一个非常良好的产学研生态,这对中国非常重要,硅谷是怎么做起来的呢?一方面学校允许他去流动,就是教授可以出来创业,也可以回到学校。



Q6


数说故事现在在大客户、SaaS已经有了一些突破了,跟大家分享一下数说的商业模式?


06

徐亚波博士:

首先数说故事原来是做大客户比较多,现在我们也不是只做大客户了,我们是从大客户向中腰部客户去延伸的一个阶段,很多中腰部客户也做用了我们的东西。


我有一个理念就是服务放大产品价值,这是我们在公司提的最多的,怎么正确摆清楚产品和服务的关系?比如说你服务大客户的时候,你说你完全没有服务是不现实的。但是如果说你完全去通过定制化服务去解决也是不对的。我们的逻辑是说,我们肯定要去提供一些服务的人,但是这些服务的人真正懂行业Knowhow,它能够很大程度去放大产品价值,这是我们公司的一个核心理念。这两者的关系就是这样的。


第二,在务实的落地产品层面,要能做到刚刚说的PaaS平台比较强悍,场景比较多,你才能够服务大客户,其实中腰部客户也能服务,我觉得这个里面还有一个更重要的点就是服务放大产品价值的时候,服务要成为我们的产品和客户中间的桥梁,要能把解决方案,把丰富的APP组合成一个解决方案,这个解决方案能交付给他。这是我理解和业内大部分企业一样的。


第三,在我们公司同样重视解决方案和客户成功。我理解在过往几年,其实很多做SaaS的公司非常强调客户成功。但是低端的客户成功其实就是要回答客户,想办法up sale客户,是这样一个逻辑。我觉得我们公司要做的是更高级的,实际上是帮助客户真正的成功。实际上它要有行业的指导能力,要从前到后解决业务问题。也就是说可能从这个角度来讲,我们服务会比一般的公司更高端一些,是这样一个大逻辑。


第四,天然的战略上的选择问题。我觉得有一些天然的赛道就是很难SaaS化的。比如说它涉及到客户一些很私密的内部数据,你很难想象像Palantir公司在美国去做CRA,去做SaaS化。我们这个天然的是叫OpenData,所以这个地方就有一个很好的优势,这个Data本身就是公开的,客户也不太介意这个数据是不是非要放到他里面去,放到他里面去也是外部来的,所以它天然有一个优势,这也是我们当时考虑从数据入手非常大的一个战略上的考虑点。


Q7


数说故事既不是传统的BI公司,也不是营销公司,商业边界是怎样定义的?


07

徐亚波博士:

本质上是什么呢?我觉得我们的使命叫数据驱动智能决策。我觉得一家公司的成功是通过做大量的决策成功的,做大量的正确的选择成功的。就好象我们从个人角度来说,是叫个人的选择大于努力。我自己设想这个企业的终极形态,它肯定会有一个企业大脑,它会在不同方面不停为企业做各种各样决策,使得企业运作效率很高,不停创新,让员工也能够自如发挥各种各样的能力,人机协同。大的形态肯定是往这个方向发展的。


从数说故事的角度来说,数说故事的边界就会被数据和应用场景这两端不停迭代的能力所限制,或者说我们是这么去看待边界的。第一,我看待任何一个场景的时候,我问这个场景是不是我应该做的,我会首先问到底是不是一个数据驱动的场景。假如说它是一个流程驱动的产品,比如说阿里做钉钉这些低代码平台,如果说是一个流程驱动的产品,是一个审批流,那这就不是我企业做的事。我一定是去看说数据能不能驱动使刚刚这个逻辑做得更好,这是我们的产品选择。我们的边界并不是说是营销还是说后台,而是去看数据能不能使这件事情变得更好。


第二,假如数据能使它变得更好,那么这就是一个候选场景,接下来我就应该看自己的能力。在我的能力上,我到底具不具备数据能力使它变得更好,也就是说我在数据上是不是有优势,或者说长期我能不能做出这个数据优势来。如果说我能发展出来,那我认为这可能就是我更会想做的,或者说战略上就会升到另外一个级别去看这个事。


第三个级别是我长期去做这个事情,我的客户基础会不会使得我的成本会比行业更低。也就是说我刚刚说的,我在客户身上能不能复用。所以这个逻辑是很清晰的,这个场景是不是我想做的,数据能力能不能到,竞争力上是不是有足够优势,只要是这个,我根本不会去管边界的问题,但是只要不是这个,我根本不会去碰,基本上就是这样一个逻辑。


Q8


关于数说故事自身,以及徐总您对市场的融资节奏、估值的把握,您怎么看待这个事?


08

徐亚波博士:

今年疫情开始的时候,我觉得我们是很幸运的,因为我们在去年做了两轮融资,今年年初的时候做了一轮,前后三轮融资了五六亿,我觉得储备了足够多的粮食,真的是很幸运。回到资本市场,在别人特别看好的时候我反而有点冷静。但是在今天这个时候,我还是要想办法给所有同行一些共同的信心。


从投融资上可能有高潮和低潮,从业务上没有那么多的高潮和低潮,或者说他只是一个轻微的上下浮动。比如说在疫情之下,企业上半年会节省一些,因为要应对不确定性。到了下半年,他觉得情况稳定下来了,他还是会重新花钱去升级。或者是疫情之后,他会更加想加强数字化和线上化。在疫情的几年里,我们一直看到这样的趋势。比如说去年整个行业普遍比较好,是因为去年经过前年疫情一定的压抑之后,去年大家都觉得比较稳定了,就开始谋求数字化这件事。所以我觉得大家淡定一些。


另外,从融资角度来说,在以前比较火的时候,很多公司估值都比较高,肯定还会有一个回归到区间的过程。慢慢把自己的营收做上去,把自己的能力做上去,使得你的估值和营收相匹配,这个时候又会重新走向一个正确的节奏。


也就是说我觉得创业者始终要用乐观的心态看问题,就是说把它看成是一个公司调整节奏,回归到一个正常的好节奏上,这样所有公司都可以走得更远一些,这个对行业不是坏事。


Q9


对香港和东南亚华人区的数据科技、数据产业怎么看?


09

徐亚波博士:

我自己在香港读书的时候,正处于香港的黄金时代,当时香港的几所大学开始呈现欣欣向荣,很多海外教授回到香港任教。其实大家不从事这一行不知道,其实在整个华人科学家领域,做的最强的两个领域,一个是数据科学,一个是计算机视觉领域(CV)。今天你在CV领域看到非常多的华人科学家,包括商汤、云从等等一系列的公司都是基于CV来做的。数据科学领域也很多,包括我原来的导师,在这个领域里做的都是非常棒的,所以在这一块中国的人才基础非常强。


第二,经过这两个领域长达二三十年的发展,其实中国的人才厚度已经很厚了,已经接近TOP了。所以我自己非常看好在这两个领域出身的技术型创业者,他只要能比较接地气,我是非常看好的,尤其是在整个东南亚和香港,我觉得还是非常有优势的。


另外,传统意义上大家觉得香港不太擅长商业创新之类的,我觉得这也是一个误区。其实后来从香港毕业出来去做了很多科技企业的人很多,只是说香港比较小,承载不了巨大的市场。


数说故事DS商学院7月将全新重磅推出“超级飞轮”增长系列直播,行业大咖云集,数据营销独家干货分享。第一期于2022年7月7日将以《重塑“超级飞轮”——品牌加速增长的数字化引擎》为主题首播,扫码超前预约!


微信扫描二维码

微博扫描二维码