HTML翻译模式详解:保留标签结构的秘密

为什么需要 HTML 翻译模式

电商平台的产品描述通常包含大量 HTML 标签,普通翻译工具在处理这类内容时,往往会损坏标签结构或把标签名称一起翻译,导致原有格式完全破坏。

工作原理

  1. 解析阶段:系统首先解析输入的 HTML,建立 DOM 树结构
  2. 提取阶段:仅提取文本节点内容,保留所有标签和属性原样不动
  3. 翻译阶段:对提取的纯文本进行翻译
  4. 重组阶段:将译文回填到原有 DOM 结构中,输出翻译后的完整 HTML

使用场景

  • 亚马逊 A+ 内容(EBC)翻译
  • Shopify 产品页面 HTML 翻译
  • 邮件营销模板多语言翻译