有人说热门的“直播卖货”和20年前的“电视购物”没有本质区别。然而,仅从用户数据的角度来看,电视购物无法获得用户数据的收集、分析和沉淀,无法反馈和优化用户肖像,指导企业生产、设计和销售产品。“直播销售”只是新零售时代多元化的销售场景之一。屏幕后面,有一个巨大的数据湖,消费者看不见。企业正在培养“阅读技巧”,智能营销系统也在数据湖中慢慢生成。
但要实现这样一个美好的愿景并不容易。“我们已经制作了数据湖,但他不会使用业务投诉系统;老板不喜欢投资很多钱,但看不到明显的业务增长;真的很难引入人工智能模型算法,技术不知道该怎么办。”一家老国有企业的数字业务负责人向马克投诉。
企业也逐渐意识到,传统和新一代的数据仓库技术与各种大数据平台/数据湖/湖仓库的融合并不是一种替代和颠覆性的关系,而是一种相互补充和完善的关系。通过各种共生模式的数据存储和处理,可以满足日益不断变化的内外数据应用需求。同时,经过不断的实践,企业对数据应用需求的理解也从特定、稀缺、长周期的“奢侈品”逻辑升级为必要、广泛、快速迭代的“流通商品”逻辑。这使得过去的数据管理范式不够快速和灵活,缺乏不断改进可持续运行的方法。因此,企业也在积极寻求与现有数据管理模式相互补充的新概念。因此,Dataops走到了“历史前台”。
最近,我们成为了一个客户。客户有多个信息系统,存在系统之间没有连接、数据岛等问题。通过建立数据湖和数据池,我们整体收集和整理数据,并打开每个系统的障碍。今天,我们将重点分享可视化系统的一部分:
红柳林新建综合控制平台,收集并入湖中煤矿生产过程中的2600多个设备数据,整合分析和应用。通过与地下视频通信的跨系统调度和指挥,实现了实时跟踪人员轨迹、异常报警一键闭环处理。
然而,投资那些浮华的云本地技术确实是不利的。他说,人们越来越担心这些工具产生的大量数据。可观察数据的增长远远超过业务和基础设施的增长,这意味着不仅难以分析,而且过多的可观察数据可能会创建新的数据湖,带来数据存储和集成的新问题。
不支持多用户编写和任意修改文件:HDFS文件中只能有一个写入者,写作操作只能在文件末尾完成,即只能额外操作。目前,不支持多个用户在文件的任何位置修改同一文件的编写操作。 其它缺点:类似于MPP架构,Hadoop/HDFS架构可扩展性差,建设数据湖时资源浪费。
在项目的早期阶段,少数乡镇的数据量并不大,但涉及到广泛的数据。因此,为了提高系统结构的稳定性,减少后期项目的重复建设,中国系统数据创新BU的建设理念是建立统一的数字基础,实现数据的统一收集和收集,为后续的农村应用提供基础。通过收集农村数据资源,实现数字农村数据湖、基础库、主题库的建设,形成完整、标准的数据资源库。