Skip to content

数据处理

本工具旨在为您提供灵活、高效的字段级数据清洗与转换功能。无论是处理简单的文本替换,还是复杂的 JSON 字段提取,都能通过直观的界面快速完成。


1. 界面概览

在进入具体处理步骤前,您可以看到主界面分为三个主要区域:

  1. 处理方式选择:顶部单选按钮,决定对数据执行何种类型的逻辑。
  2. 配置面板:中间动态区域,根据选择的处理方式展示不同的配置项。
  3. 实时预览:底部区域,输入原始值后,可立即看到处理后的输出结果。

dataproc_overview


2. 处理方式详解

2.1 替换

用于将指定的文本替换为新内容。

  • 全字匹配:勾选后,仅当整个单词完全匹配时才替换(防止误伤,如:匹配 cat 不会替换 category)。
  • 正则表达式:支持使用标准正则语法进行高级匹配。
  • 批量模式:点击下方“切换模式”,可直接粘贴 旧值|新值 列表进行批量定义。

dataproc_replace

2.2 计算

针对数字类型字段的四则运算。

  • 支持加 (+)、减 (-)、乘 (*)、除 (/)。
  • 常见场景:单位换算(如:分转元,输入 除以 100)。

2.3 日期/时间戳 (Timestamp)

把 JSON 中常用的时间戳 (Timestamp)转换为一般时间格式。

  • 支持将 10位(秒)13位(毫秒) 时间戳转换为可读的日期字符串。
  • 您可以自定义输出格式(如:yyyy-MM-dd HH:mm:ss)。

2.4 宏处理 (强烈推荐 ⭐)

这是最强大的功能模块,通过简单的“占位符”组合实现复杂的清洗逻辑。

常用宏命令说明:

宏指令功能描述示例
{Value}引用原始值¥{Value} -> ¥100
{Trim}去除首尾空格清理输入干扰
{ExtractNum}提取纯数字从“价格100元”中提取“100”
{Upper} / {Lower}大小写转换统一编码格式
{Prefix:} / {Suffix:}添加前/后缀ID_{Value}
{Regex:正则}正则提取匹配项提取手机号、ID等

dataproc_macro


3. 常见问题 (FAQ)

Q:为什么我在输入正则表达式时预览区显示“正则格式有误”?A:这是正常现象。由于预览是实时的,当您的正则表达式只写了一半(例如输入了 ( 但还没输入 ))时,正则语法不完整。请继续输入,语法正确后预览会自动恢复。

Q:宏命令可以组合使用吗?A:可以。例如输入 {Trim}{Upper}{Prefix:LOG_},系统将按顺序:先去空格、再转大写、最后加上前缀。

Q:处理后的结果如果不满意怎么办?A:底部预览区是完全实时的。您可以随时修改配置,直到输出框(Output)显示的结果符合预期,再点击“确定”保存。