这一次,JD.COM还升级了两个能够积累高质量行业数据的平台:全新的优佳DaaS和言犀智能服务,支持行业应用对数据的新需求。
曹鹏还举了一个例子。通过言犀平台,行业用户可以在不到一周的时间内完成从数据准备、模型培训到模型部署的全过程。以前需要10多人的科学家团队,现在只需要1-2个算法人员。通过平台模型加速工具优化,可以节省90%的推理成本。
数据系统完全集中在单个平台上,企业完全在云环境中运行。企业所有员工都可以轻松访问所有数据,对用户友好:5%
整个大数据应用的基础是准确、及时、统一、集成的数据平台。为了满足当前和未来的数据分析需求,大数据平台需要坚实的数据基础,包括统一的企业数据仓库向下整合相关财务、业务、风等结构化和非结构化数据,为各种数据分析提供统一的数据平台,以及与其他system集成的信息,为用户提供方便的访问入口。
定义数据类型:包括主机、交换机、应用程序和应用程序配置文件,配置人员将在收到需求后进行研究。 定义数据的核心属性:以主机为例,需要报告或收集IP、资源的核心属性,如序列号、机房、云厂商等。 构建数据模型的直接关系:梳理包括关系、依赖关系、运营关系等资源与资源之间的对应关系,以便后续生产资源拓扑。例如,如果应用程序使用一种数据类型,主机使用另一种数据类型,则应用程序将依赖于主机,主机可以反过来组成应用程序。 消费场景确认:确认消费场景,就是确认数据在哪个阶段使用。如果用于集群部署,可能需要在应用维度或相应的操作和维护操作中进行相关部署。 建立数据规范:生命周期(从创建、生产到部署)的过程是什么?平台如何感知数据状态变化后的数据状态?