为什么需要 HTML 翻译模式
电商平台的产品描述通常包含大量 HTML 标签,普通翻译工具在处理这类内容时,往往会损坏标签结构或把标签名称一起翻译,导致原有格式完全破坏。
工作原理
- 解析阶段:系统首先解析输入的 HTML,建立 DOM 树结构
- 提取阶段:仅提取文本节点内容,保留所有标签和属性原样不动
- 翻译阶段:对提取的纯文本进行翻译
- 重组阶段:将译文回填到原有 DOM 结构中,输出翻译后的完整 HTML
使用场景
- 亚马逊 A+ 内容(EBC)翻译
- Shopify 产品页面 HTML 翻译
- 邮件营销模板多语言翻译