警告位置
此警告信息位于“导入错误”部分:
警告说明
当您的报告包含系统无法识别且无法转换为 xHTML 的字符时,将触发此警告。
创建视觉文件时使用的某些功能或技术与 PDF 格式兼容,但在 xHTML 中可能无法正常工作,从而影响文本提取。
在提取到最终报告的技术方面的数据中,这些无法识别的图形元素仅以小方块“”的形式显示。
最常见的问题源于源文件中实现的以下功能:
- 连字
- 不间断空间
- OpenType 功能
如何解决
首先,您需要按照以下步骤找出问题所在:
在 ParsePort 平台上转换您的 Excel 模板和 PDF 报告。
在“验证摘要”页面上,转到“导入错误”,复制“FactContainsUnreadableCharacters”消息中出现的元素(或其中一个元素)的名称,例如 DisclosureOfIncomeTaxExplanatory。
- 转到“查看器”选项卡
- 打开侧边栏,然后将元素粘贴到搜索框中。
- 滚动到高亮显示的元素并点击它。
查看器将直接带您到报告中标记的元素。
4.点击二级侧边栏中的HTML按钮。
在弹出的窗口中,查找方框字符“□”,它表示图形问题(也称为“Unicode”问题)。
图形问题可能由多种原因引起:
- OpenType 功能
- 连字
- 不间断空间
- 要点
如果您使用 InDesign,请点击此处查看如何避免和/或消除这些图形问题的指南: 手册
如果你使用 Word,图形问题最常见的原因是项目符号。我们建议您使用数字或字符而不是项目符号进行列举。