发布时间:2020-07-23作者:DataStory
今天又是一个普通的早晨,一如往常,你用指纹识别打开手机查看微信,小度小度为你导航来到公司,你终于赶在9点前人脸识别打卡。这些你习以为常的生活,如果放在10年前,还算是新鲜事。科技发展带来的变革,不止是在宇宙探索、工业发展、国防建设等遥远的领域,科技渗透到了生活的方方面面。
我们把这些为生活带来便利的科技归结为人工智能(Artificial Intelligence, AI),AI作为计算机科学的一个分支,是研究使计算机模拟人的某些思维过程和智能行为的学科,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。其中,语言识别、图像识别、自然语言处理是一站式大数据及AI智能商业应用提供商数说故事一直专注深耕的领域。
对于广大Marketer来说,AI除了融于生活,更是贯穿工作,但你知道它是如何发挥作用的吗?接下来,小编将为大家展示AI在以下三个方面的应用:
情感判断是如何形成的?
如何去除广告杂音和水军?
知识图谱是什么?
情感判断是AI在商业分析中最常见的应用之一。传统的情感判断是对句子或者篇章进行情感倾向的判断,但人类的情感是微妙、隐晦、多指向的,传统的情感倾向判断无法满足前沿商业分析需求。
数说故事在篇章级情感判断模型的基础上,进一步实现技术突破:
🔹实体情感分析(Entity-level sentiment analysis)能够对单篇文章中出现的不同品牌不同明星进行单独的情感指向判断;
🔹“O-F-S(Object-Feature-Sentiment)三元组专利技术”,服务于细粒度的分析(Aspect-level sentiment analysis),能够实现在文章中对指定分析对象(Object)在500+分析维度(Feature)上进行情感判断,并且实现85%+的综合准确率。
我们以这句话为例:“今天在山姆店买披萨,服务员态度很不好。” 可以提取出:主体——服务员;特征——态度;情感——很不好。进而根据事先建立好的一套评价维度,对语义进行细粒度的情感分析。
这些新技术大大提高了商业情感分析的准确性,减少了纯人力在处理原始数据上的投入。
看到这里,也许你会疑惑,现在广告和水军这么多,机器跑出来的这些情感分析准不准呢?这就涉及到数说故事的另一项技术——去水。
首先我们要了解水军的定义,在数说故事,我们是这样划分水军的:
❌ 在网络中针对特定内容发布特定信息的、被雇佣的网络写手;
❌ 在网络中有组织的反复转发和评论同一明星、电视剧的狂热粉丝;
❌ 电商、微商、代购类账号,表现为大量发送产品广告和购买信息。
AI就像一位安检员,对每一条准备进入数据库的信息进行筛查,以微博为例,机器会基于事先设定好的规则,根据用户基本信息(如互粉数、转发数)和微博内容(如发布来源、纯转发比例)来判断水军并把他们从数据库中剔除。
引入人类的知识是AI的重要研究方向之一,知识表征和推理受到了人类解决问题方法的启发,旨在为智能系统表征知识,从而获得解决复杂问题的能力。
知识图谱其实并不是一个新鲜的东西,在上世纪50年代Richens 就最先提出了语义网(Semantic Web)的概念,随着计算机算力和算法的发展,语义网也在逐渐发展,在2012年由Google推出了知识图谱的概念。通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。
在过去的几年里,数说故事陆续根据实际客户需求,构建固定领域、固定知识结构的知识图谱,服务于信息查询,垂直领域智能问答,产品创新等不同应用。
在过往的服务中,这种“固定”知识图谱可以达到相对较高的准确性,但是对于使用有较大的限制。只能在预先定义的结构中进行探索查询,无法将更多的知识容纳进来,导致任何的知识结构改变都需要重训练新的模型,改造代价非常大。
如何在一个更加通用的框架实现客户需求和技术的统一,是数说故事一直努力的方向。
历经数次迭代,数说故事使用知识图谱的技术构建了一个通用型商业知识图谱,区别于传统的开放性知识图谱,如Freebase、YAGO、DBpedia等,我们构建的知识图谱在开放性知识图谱的前提下,主要面向商业研究领域丰富知识链接,以“品牌 - 产品 - 人 - 媒介”为核心向外不断拓展。目前,该图谱依托数说故事XDP体系,实现近实时数据解析入库,包含100w+实体,近亿级实体关系。
数说故事 Mamba Search是一个基于通用型商业知识图谱的开放性实体属性挖掘系统。基于数说聚合全量数据解析生成,实现全场景知识体系覆盖。Mamba Search“探索、关联、拓展”三大功能,让原本无法具象展示的知识图谱变得触手可得。
1.探索
Mamba Search是通往数说故事知识图谱的入口,一键搜索,即时可得,只需简单键入你想探索的关键字,就可以得到完整的关联知识。
2.关联
以“雅诗兰黛”这一实体为例,一键搜索,即可看到雅诗兰黛在各个阵地的声量、词云,最重要的是可以快速检索由AI自动梳理好的关联关系,如创立时间、创立地点、品牌代言人、首席执行官等。如果信息的可用评分较低,点击关键词可直接通过相关原帖确认信息准确度。
3.拓展
点击实体的关联词,可继续向外拓展探索,得到一个立体多维图谱。继续以“雅诗兰黛”为例,围绕这一品牌,我们可以在Mamba Search继续探索其子品牌“lamer”的相关内容,也可以探索其代言人“李现”的关联关系以及李现代言过的其他产品的相关情况,根据需求不断深挖。
通过构建KGaaS(知识图谱即服务),我们将其应用于各种上层应用中,包括品牌研究、产品研发、代言人分析、影视剧预测等商业分析领域,也封装成通用知识检索、关联分析与挖掘、自然语言问答、自然语言生成等程序类API提供对下游业务应用。
关于知识图谱的更多应用,下期推文小编将继续为你解读。
微信扫描二维码
微博扫描二维码