文本提取函数家族

在处理复杂数据(如身份证号、物流单号、带有特殊编码的产品型号)时,一串字符中往往只有部分对我们有价值。本节带你掌握 LEFTRIGHTMID 这“剪刀三剑客”,轻松从文本的任意位置截取你所需要的信息。

1. 为什么需要文本提取?

在企业实际业务中,数据源往往是不规范的。例如,系统导出的一列数据可能是类似 BJ-2023-A01 这样的组合编码。 如果你只想分析“地区(BJ)”或者“年份(2023)”,直接用它是不行的,必须把它拆开。这个时候就需要用到文本切割函数:

LEFT

从文本的最左边开始切

MID

从文本的任意中间位置切

RIGHT

从文本的最右边开始倒推切

2. LEFT: 从左侧提取

=LEFT(文本, 提取字符数)

场景:有一串订单号 SH-998241,前两位表示城市,我们需要提取城市代码。

A (原始单号) 公式 提取结果
SH-998241 =LEFT(A2, 2) SH
GZ-123456 =LEFT(A3, 2) GZ

解析:从文字的第一个字开始向右数,截取前 2 个字符。

3. RIGHT: 从右侧提取

=RIGHT(文本, 提取字符数)

场景:同样的订单号 SH-998241,我们需要提取其后六位的数字流水号。

A (原始单号) 公式 提取结果
SH-998241 =RIGHT(A2, 6) 998241
GZ-123456 =RIGHT(A3, 6) 123456

4. MID: 自由的中间提取

MID 是三个函数中最强大、也是最重要的一个。只要你告诉它“从第几个字开始切”,“切多长”,它就能把中间任意一段取出来。

=MID(文本, 开始位置, 提取字符数)

参数解析

  • 文本 (text):你要切的那串字符或单元格引用。
  • 开始位置 (start_num):从第几个字符开始提取(最左边第一个字符是 1)。
  • 提取字符数 (num_chars):总共要有几个字符长。

场景:有年份产品码 BJ-2023-A01,我们需要提取中间的 4 位年份“2023”。

A (原始单号) 公式 提取结果
BJ-2023-A01 =MID(A2, 4, 4) 2023

解析:由于 "BJ-" 占了 3 个字符,所以 "2" 是第 4 个字符。我们要截取 2023,长度为 4。故开始位置是 4,长度也是 4。

5. 综合实战:从身份证号提取生日

这是日常办公中极其常见的任务:中国大陆居民身份证号码通常为 18 位。其中第 7 位到第 14 位这 8 位数字组成的就是出生年、月、日。

430481199912011234

提取八位生日

=MID(A2, 7, 8)

结果: 19991201

仅提取四位年份

=MID(A2, 7, 4)

结果: 1999

进阶提示补充: 提取出来的生日由于是纯数字字符串,Excel 会默认将其视为文本型数字。如果你想要按日期格式(如 1999-12-01)展示,可以先用 TEXT 函数配合,例如:
=TEXT(MID(A2, 7, 8), "0000-00-00")