DS低代码平台 | 拖拉拽,大数据平台开发so easy

发布时间:2021-03-03作者:DataStory

DS低代码平台专栏


大数据平台搭建的高技术门槛、高建设成本问题一直是企业实现数字化转型的一大“拦路虎”。

数说故事低代码平台专栏,将通过深入浅出的技术讲解,帮助企业理解如何基于平台实现自主开发,提升效率。

专栏的第二期文章,将围绕各个工作流程中,低代码开发平台的应用展开介绍。回顾第一期请点击《0代码开发大数据应用,真的可以实现吗?》


DS低代码平台专栏第一期,我们介绍了低代码平台的概念和演变过程,还介绍了数说故事大数据低代码智能开发平台(以下简称“数说低代码平台”)专注简化及加速企业大数据应用的开发工作,让懂业务的非技术人员可以更加关注数据来源、采集条件、数据维度、分析模型、可视化呈现等实际的业务工作,而不需要关注传统软件研发流程中的专业复杂工作,诸如代码开发设计、高并发设计、高可用设计、运维部署架构设计、软件打包构建等。


接下来,让我们具体看看在数据采集、模型管理、智能标签、数据分析、应用系统搭建、多租户管理这6大进程中,低代码平台可以做些什么?



可视化数据采集、ETL


1.支持快捷对接多源异构数据


可连接、读取数据进行数据处理,支持接入的数据源包括主流关系型数据库(MySQL、Oracle、MicroSoft SQL Server)、非关系型数据库(ElasticSearch、MongoDB),众多新型的大数据引擎(HIVE、Kylin)、 或直接上传本地文件等。  

数据导入后直接基于可视化页面进行多源异构数据的行/列追加和映射,在单个流程中解决不同来源数据的融合工作





2.简便数据处理、清洗


对海量数据的处理等工作可以用可视化的拖拽式交互来完成。无论是对数据打标签,或是对数据进行合并、关联、去重、过滤、转换等操作,都可以使用内置的各种“算子”来拖拽实现。

例如聚合运算算子(基础转换)、 打标签算子(码表类)、 概念提取算法类算子(算法类)、文本指纹及摘要算子(算法类)、关系识别算子等。

不仅是内置算子,也支持开发者将自己开发的算子注册上去, 做到“一次开发、多次复用”


3.复杂DAG调度配置


以拖拉拽的方式生成作业DAG,将任务之间的相互依赖变得简单,支持java包、shell脚本、kettle配置、数据质检、数据同步(FTP/关系型数据库)、ETL工作流、作业引用等多种task类型。同时提供作业定时、作业超时、任务重试、失败告警等完善的作业调度功能。




可视化算法标注、训练与模型管理


1.高效数据协同标注


系统支持分类标注、实体标注、实体属性标注、实体关系标注等多种标注类型,内置了搜索标注、批量标注、词典预标注等多种工具,有效降低人力成本和标注时间。





2.模型训练与服务API在线生成


用可视化的方式训练高级算法模型,无需关注复杂的机器学习知识。在完成数据标注后,就可以启动训练任务, 并直观看到训练的模型质量, 若模型效果满意,直接可一键生成算法服务API




3.统一模型管理


模型训练、参数输入配置、算法服务拉起等关键过程进行了统一的流程和配置项抽象,用户可以基于数说故事内置的模型进行数据标注训练, 也可以导入自己开发的模型,对接/实现平台的接口规范, 将自定义模型纳入平台管理,持续积累企业/用户自己的模型、并统一管理。





多实体、万维智能标签


除了常见的用户(人)标签外,系统支持对商品(货)、店铺/渠道(场)、活动等多种实体进行个性化标签的定义和配置。通过数据标签化、构建不同研究实体(人/货/场等)的标签树,并通过组合筛选标签(交并差)的方式,快速获取关注群体的画像。


全流程可由业务人员自行配置和定义,支持在百亿数据之上定义和生成标签,支持万级维度的标签列,优选多种不同存储介质,由平台自动调度,屏蔽了传统“用户画像、群体圈选”场景的技术开发难度及性能问题。





可视化数据分析


1.即席分析


对于已经处理完毕的数据,可以通过“工作表”对其进行可视化分析,用户可以选择不同的分析模型,并以拖拽和UI交互方式完成全部的数据分析工作





2.自助数据主题分析(异步)


若对历史海量百亿数据做多维聚合、关联分析, 运行时间可能在分钟到小时级,也支持创建“数据分析主题”(支持多源异构数据交叉分析),所发起的查询会以异步查询任务的形式被追踪,等待分析跑完即可在线查看或下载分析结果。



可视化API与应用系统搭建 


1.可视化API配置、开发


用户通过无代码分析得到的结果,可以快速发布为API,并自动化形成API Doc等信息。数说低代码平台提供了标准的数据返回格式的安全控制策略、缓存策略等,并自动化对API进行了数据统计。




2.可视化应用“APP”配置


用户以在应用配置页面, 通过UI拖拽的方式,完成应用APP的配置,包括导航菜单、页面布局、数据渲染、交互行为等。




3.应用版本开发与发布流程


数说低代码平台支持灵活的配置与版本管理

· 应用开发-测试-上线

在DEV(开发)环境、UAT(测试)环境、PRD(生产)环境之间,分别进行配置信息的隔离,并且三种环境下分别有三种不同的访问入口。确保环境隔离的正确性与安全性。




· 局部发布、 全量发布

在对配置进行更新时,可以分别选择“全量发布”或“局部发布”,这意味着用户可以仅仅发布某一个按钮的改动,而不用将其他的改动发布出去。




4.多主题UI与个性化


用户可以快速选择导航栏样式、主题风格等,也可以定制应用的首页、logo、域名、title等信息。






多租户组织管理支持


在无需编码的前提下,可以将制作完成的应用分发给不同的的客户,并定制化不同客户的访问范围,包括菜单导航的可访问范围、按钮级的功能访问范围。





下期文章,我们将就低代码工具搭建的应用案例具体展开介绍,请持续关注“数说故事”公众号的系列专题介绍,也欢迎在留言区与我们互动交流。


应用案例 










如果您想申请试用数说故事大数据低代码智能开发平台,请扫描下方二维码填写表单。




微信扫描二维码

微博扫描二维码