《数据资产管理核心技术与应用》第一章,如何认识数据资产?

摘要:《数据资产管理核心技术与应用》是清华大学出版社出版的一本图书,全书共分10章,第1章主要让读者认识数据资产,了解数据资产相关的基础概念,以及数据资产的发展情况。第2~8章主要介绍大数据时代数据资产管理所涉及的核心技术,内容包括元数据的采集与
《数据资产管理核心技术与应用》是清华大学出版社出版的一本图书,全书共分10章,第1章主要让读者认识数据资产,了解数据资产相关的基础概念,以及数据资产的发展情况。第2~8章主要介绍大数据时代数据资产管理所涉及的核心技术,内容包括元数据的采集与存储、数据血缘、数据质量、数据监控与告警、数据服务、数据权限与安全、数据资产管理架构等。第9~10章主要从实战的角度介绍数据资产管理技术的应用实践,包括如何对元数据进行管理以发挥出数据资产的更大潜力,以及如何对数据进行建模以挖掘出数据中更大的价值。 图书介绍:《数据资产管理核心技术与应用》 今天主要是给大家分享一下第一章的内容: 第一章的标题为认识数据资产,总共分为了8个小节。->关注清哥聊技术公众号,了解更多技术文章 1.1 数据资产的基本介绍 数据资产通常是指那些可以通过分析来揭示价值、支持企业决策制定、优化企业流程、预测行业的未来趋势或产生更大的经济价值的数据集。这些数据可能是由企业自身产生也可能是从外部获取(如社交媒体、第三方数据提供商、网络爬虫等)的,而且这些数据的格式多样,可能是结构化数据、半结构化数据或者非结构化数据。 数据资产的关键特性:可用性、可访问性、完整性、可靠性和安全性 可用性:指的数据资产需要能被使用,如果无法被使用,那么数据资产就无法体现其核心价值,而数据资产的可用性则需要依赖数据质量、数据监控等很多关键要素的支撑。 可访问性:指的是数据资产需要能够被数据的使用者访问,如果无法被访问,那么数据资产也会显得没有任何的价值,因为只有能被访问,才能去挖掘出数据的更多价值。 安全性:指的是数据资产需要保障其数据的安全性,防止数据被泄露、丢失或者被黑客攻击篡改等。 可靠性:指的是数据资产一定是可靠的,不然无法用于企业的决策和判断,如果数据不可靠,那么通过数据做出来的决策肯定也不会可靠,从而会给企业带来巨大的损失。 完整性:指的数据资产中的数据一定是完整的,如果数据不完整,那么获取到的信息也不会完整,不完整的数据是无法用于数据分析、数据决策等。 数据资产的几种常见类型: 非结构化数据: 非结构化数据没有预定义的格式或组织,因此更难以处理和分析。这类数据包括文本文档、PDF文件、电子邮件、视频、图像和音频文件。虽然处理起来更复杂,但非结构化数据通常提供更丰富的信息和见解,对于机器学习和自然语言处理等领域尤其有价值。 结构化数据: 这类数据通常存在于预定义的数据模型之中,因此它们格式清晰、易于搜索和组织。结构化数据通常存储在关系数据库中,如SQL数据库,这类数据库支持复杂的查询、报告和分析。例如,客户信息、销售记录、库存数据和金融交易都可以以结构化的形式存储。通常他们表格形式存在,每一列代表一个数据字段,每一行代表一个数据记录。 半结构化数据: 半结构化数据介于结构化和非结构化数据之间,它们可能不符合严格的数据库模型,但包含标签或其他标记来分隔语义元素,并使元素的层次结构可识别。XML和JSON是半结构化数据的典型例子,它们被广泛用于网络数据交互。 实时数据: 实时数据是指需要立即处理的数据,以便快速做出响应或决策。这类数据在金融交易、网络分析、物联网(IoT)设备监控和在线广告投放中非常常见。实时数据处理通常要求具有较高的技术能力,以便快速捕捉、分析和响应数据流。 时间序列数据: 时间序列数据是按照时间顺序收集的数据信息,通常会用于分析数据的趋势、周期性和季节性变化等,比如股票价格、气象记录和监控数据等都是时间序列数据的例子。 地理空间数据: 地理空间数据含有关于地理位置的信息,这类数据在规划、物流和位置分析中非常关键。比如地图数据、卫星图像和GPS追踪数据都属于这一类型。 元数据: 元数据是描述其他数据的数据,它可以包括文件大小、存储路径、创建日期、作者信息等。元数据有助于组织、管理和检索数据,通常是数据管理、数据仓库、数据湖中不可或缺的核心组成部分。 1.2 数据资产的分类 数据资产分类的方式通常包含如下几种 根据数据敏感性分类:根据数据的敏感程度,通常可以将数据分为不同的级别,如公开数据、内部使用数据、敏感数据、隐私数据、绝密数据等。这种分类方式一般有助于企业或者组织对不同级别的数据采取不同的保护措施,以确保数据的安全性和隐私性。 根据数据来源分类:根据数据的来源,通常可以将数据分为很多不同类别,如会员数据、商品数据、业务数据、交易数据、第三方数据等。这种分类方式一般有助于企业或者组织更好地了解数据的来源和用途,从而更好地利用数据。 根据数据用途分类:根据数据的用途,通常可以将数据分为各种不同的类别,如分析数据、决策数据、销售数据、风控数据等。
阅读全文