实用技巧

当前位置：首页 > 实用技巧 >

excel计算和储存数据的文件（excel中啥是计算和存储数据的文件）

来源：原点资讯(m.360kss.com)时间：2023-10-29 11:41:36作者：YD166手机阅读>>

场景

虽然数据库技术和大数据已经广泛使用，公司打造内部数据平台时，对基于关系型数据库，或者是格式标准的文件，例如JSON，XML，CSV等数据一体化都相对容易。因为这些数据载体标准，变化可控，易于分辨，且都有成熟的工具/包，来辅助抽取和解析。

生产生活中，Excel文件仍然是常见数据承载媒介。公司运作的过程中，也会产生很多有价值的数据，存在易于阅读和方便传播的Excel文件中。Excel文件没有统一的格式，数据编排方式完全依赖个人的习惯和偏好，不可能被标准化。

当想把这些数据落地存储为公司的数据资产时，很难用一套通用程序来处理。虽然现在满天飞各种数据中台类产品，但只能解决企业内标准化数据源（90%都是关系型数据库）的整合问题，几乎不涉及存储在excel中的数据，导致这些文件中的数据都是游离在公司数据体系之外的。

适用对象

哪些情景，或者说工作环境中有对Excel数据治理的需求呢？总结了一下大概分成四类：

1. 工作业务流程接触很多excel中的时序数据。这些文件可能是内部产生的，也可能是外部产生的。主要依靠人阅读的方式消费文件，需要提升效率；

2. 公司产生很多有价值的数据，都在excel中，想把它数字资产化；

3. 公司有一定的IT基础，数据架构很完善，数据中台基本都已成型，想打通零散的Excel线下数据；

4. 数据公司。汇聚各类细分数据源的Excel文件，生产自己的EDB指标；

痛点

要完成上面的目标，有个痛点一定绕不过去，就是自由格式的Excel文件解析。 Excel传统上一般有3种处理方式：

1. 格式简单/标准

标准的二维矩阵形式，可用ETL工具直接导入。比如kettle，指定sheet名，数据起始的行列，preview一下数据，自动识别出列的格式，生成二维表。

直接用Python中的pandas读取也都很容易；或者Navicat都可以把直接导入数据库表中。

2. 格式复杂

有两种处理方式：

2.1 定义一个中间标准模板态（一个模板Excel）。把非标准形式的excel文件手工往这个形式转换，后者再用程序批量处理；

2.2 对每个Excel文件的每个sheet，写单独的程序去解析；

即使通过上面几种方式实现了，当文件中的数据内容、排版方式发生变化时，比如数据中间插入了一行或者一列，某个sheet改名了，单元格的指标名称改了等等，靠人或者程序去识别这类变化，都非常困难；文件改变后，还要对（手工）转换过程或者代码做相应的修改和测试，也很耗时。

识别文件内容变化，以及根据变化迅速调整处理逻辑，是解析的难点。当然，更为重要的，是用低成本（人、时间）迅速响应数据格式的变化。

格式自由

Excel格式因人而异，没有标准，想怎么弄就怎么弄。比如：

excel计算和储存数据的文件,excel中啥是计算和存储数据的文件(1)

季频和年频数据混合，且都有预测值。A列的含义丰富，既有分类，又有不同指标，还有同比

excel计算和储存数据的文件,excel中啥是计算和存储数据的文件(2)

6月和7月每个日期下面有3个指标；8月之后，每个日期就只有2个指标了；日期是合并单元格；

excel计算和储存数据的文件,excel中啥是计算和存储数据的文件(3)

水平垂直方向组合才构成完整的日期；A列看到的值和真实的值不同；

excel计算和储存数据的文件,excel中啥是计算和存储数据的文件(4)

首页 12 3 下一页

栏目热文

榕树为什么会长一棵树（榕树为什么根会长在上面）

榕树为什么会长一棵树（榕树为什么根会长在上面）

菩提本无树，明镜亦非台本来无一物，何处惹尘埃菩提树引言：菩提树是佛教最具代表意义的神树之一，其来源与释迦摩尼树下悟道有关...

2023-10-29 11:29:04查看全文 >>

榕树为什么不能独树（榕树能独木成林的原因）

榕树为什么不能独树（榕树能独木成林的原因）

“独木难成林”是过去的一种说法，现在的人不太相信了，特别是见过独树成林的景观后就更不用说了。1.“独木难成林”的‬说‬...

2023-10-29 11:43:24查看全文 >>

榕树是怎么独木成林的（榕树是怎么做到独木成林的呢）

榕树是怎么独木成林的（榕树是怎么做到独木成林的呢）

为了让榕树盆景达到枝繁、叶密、叶小的目的，主要的方法就是进行是一年内进行多次的摘叶、摘心，剪枝、控水肥的方的操作，并让其...

2023-10-29 11:37:48查看全文 >>

榕树为何可以独木成林（榕树是怎样独木成林的）

榕树为何可以独木成林（榕树是怎样独木成林的）

推荐词榕，既有包容、容纳、宽容的含义，又有容易栽植的另一层意思，倒插一枝榕丫，数年之后即能长成参天大树，福荫人间。在闽、...

2023-10-29 11:54:06查看全文 >>

榕树能成林吗（榕树种在岛上会成林吗）

榕树能成林吗（榕树种在岛上会成林吗）

榕树是一种常见的树木，在许多亚洲国家，包括印度、马来西亚、泰国和越南等都可以见到它们的身影。榕树的种类繁衍，有些可以生...

2023-10-29 11:12:39查看全文 >>

excel工作簿保存类型（excel保存是保存所有工作簿吗）

excel工作簿保存类型（excel保存是保存所有工作簿吗）

一、功能说明保存工作簿是Excel VBA中的基本操作之一，它用于将当前打开的工作簿保存到磁盘上的文件中。保存工作簿可以...

2023-10-29 11:49:37查看全文 >>

excel数据存储和处理（excel数据保存与查询）

excel数据存储和处理（excel数据保存与查询）

小伙伴们好啊，今天咱们来分享一个数据整理的实用技巧。下图是销售部门发来的一份客户订单，根据不同的订购数量，多种商品的颜色...

2023-10-29 11:45:14查看全文 >>

excel工作簿是计算和存储数据的啥（excel中处理存储的基本工作单位是）

excel工作簿是计算和存储数据的啥（excel中处理存储的基本工作单位是）

导读：本次面向对象主要是职场上的表哥OR表姐、与数据打交道的小白、被数据虐的体无完肤的社畜。其实Excel这个软件看似平...

2023-10-29 11:18:15查看全文 >>

excel工作簿保存的文件类型（excel工作簿保存方法有哪些）

excel工作簿保存的文件类型（excel工作簿保存方法有哪些）

【简介】创建工作簿后需要根据自己需要对工作簿进行保存，复杂的保存方法会影响工作的效率，以下为保存工作簿的五种方法，建议选...

2023-10-29 11:44:55查看全文 >>

excel处理并存储数据的基本单位（excel处理并存储数据的文件）

excel处理并存储数据的基本单位（excel处理并存储数据的文件）

在单元格的数字后面加上重量的单位“千克”　　　　具体操作如下：1.将光标移动到D3单元格上方，然后在单击鼠标右键，在弹出...

2023-10-29 11:38:38查看全文 >>

文档排行

本站推荐