文本提取函数家族
在处理复杂数据(如身份证号、物流单号、带有特殊编码的产品型号)时,一串字符中往往只有部分对我们有价值。本节带你掌握 LEFT、RIGHT 和 MID 这“剪刀三剑客”,轻松从文本的任意位置截取你所需要的信息。
1. 为什么需要文本提取?
在企业实际业务中,数据源往往是不规范的。例如,系统导出的一列数据可能是类似 BJ-2023-A01 这样的组合编码。 如果你只想分析“地区(BJ)”或者“年份(2023)”,直接用它是不行的,必须把它拆开。这个时候就需要用到文本切割函数:
LEFT
从文本的最左边开始切
MID
从文本的任意中间位置切
RIGHT
从文本的最右边开始倒推切
2. LEFT: 从左侧提取
场景:有一串订单号 SH-998241,前两位表示城市,我们需要提取城市代码。
| A (原始单号) | 公式 | 提取结果 |
|---|---|---|
| SH-998241 | =LEFT(A2, 2) | SH |
| GZ-123456 | =LEFT(A3, 2) | GZ |
解析:从文字的第一个字开始向右数,截取前 2 个字符。
3. RIGHT: 从右侧提取
场景:同样的订单号 SH-998241,我们需要提取其后六位的数字流水号。
| A (原始单号) | 公式 | 提取结果 |
|---|---|---|
| SH-998241 | =RIGHT(A2, 6) | 998241 |
| GZ-123456 | =RIGHT(A3, 6) | 123456 |
4. MID: 自由的中间提取
MID 是三个函数中最强大、也是最重要的一个。只要你告诉它“从第几个字开始切”,“切多长”,它就能把中间任意一段取出来。
参数解析
-
文本 (text):你要切的那串字符或单元格引用。
-
开始位置 (start_num):从第几个字符开始提取(最左边第一个字符是 1)。
-
提取字符数 (num_chars):总共要有几个字符长。
场景:有年份产品码 BJ-2023-A01,我们需要提取中间的 4 位年份“2023”。
| A (原始单号) | 公式 | 提取结果 |
|---|---|---|
| BJ-2023-A01 | =MID(A2, 4, 4) | 2023 |
解析:由于 "BJ-" 占了 3 个字符,所以 "2" 是第 4 个字符。我们要截取 2023,长度为 4。故开始位置是 4,长度也是 4。
5. 综合实战:从身份证号提取生日
这是日常办公中极其常见的任务:中国大陆居民身份证号码通常为 18 位。其中第 7 位到第 14 位这 8 位数字组成的就是出生年、月、日。
提取八位生日
结果: 19991201
仅提取四位年份
结果: 1999
进阶提示补充: 提取出来的生日由于是纯数字字符串,Excel 会默认将其视为文本型数字。如果你想要按日期格式(如 1999-12-01)展示,可以先用 TEXT 函数配合,例如:
=TEXT(MID(A2, 7, 8), "0000-00-00")