你有一份待查收的 TextIn 文档解析内测邀请函!
近期,为便捷智能文档处理流程,TextIn 文档解析推出内测版本,支持内置参数,完成去水印与切边矫正处理,有效提升解析准确率与输出结果质量。
如何获得内测资格: 内测功能以白名单邀请制的形式进行小范围测试,如有需要,请在公众号后台或扫描文末二维码联系我们进行开通。
内测功能详情见下:
1 内置参数,去除图片和 PDF 水印
实操场景下,部分带有明显水印的文件,会在解析过程中由于水印干扰产生错漏字现象。
TextIn ParseX 将去水印功能内置到了产品中,帮助提升解析效果,减少文件另行去水印带来的时间消耗,同时也让代码编写更为便捷。
使用示例:
步骤一:登录 TextIn 官网 TextIn - API 中心,获取 app-id 和 secret-code。
步骤二:调用官方示例代码:
步骤三:将下列去水印的参数集成到代码中,替换上述源代码中的 48-62 行
步骤四:运行最终替换好的代码并得到去水印后识别更精准的解析文件。
效果示例:
可以看到,不仅解析结果中全文没有出现水印上的文字内容,还一并去除了图片上的水印,用户可以轻松提取到干净的文字及插图。
注意事项:
去水印参数支持图片、PDF、word 文件;
目前去水印的能力擅长解决倾斜文本,对于图片类、logo 文字、横排文字的去除效果有待提升,还请理解。
2 内置图片切边矫正参数,提升识别效果
内测版本还支持用户内置图片切边矫正能力,用于提升拍摄角度不正或歪曲变形的照片的识别效果。
常用场景:医疗报告单据、征信报告、作业照片等
使用示例:
步骤一:登录 TextIn 官网 TextIn - API 中心,获取 app-id 和 secret-code。
步骤二:调用官方示例代码
步骤三:将下列切边矫正增强功能的参数集成到代码中,一键替代源代码中的 48-62 列
步骤四:运行最终替换好的代码并得到切边矫正后识别更精准的解析文件。
效果示例:
无切边矫正的效果 1
无切边矫正的效果 2
无切边矫正的效果 3
有切边矫正的效果 1
有切边矫正的效果 2
有切边矫正的效果 3
可以看到,在矫正之后,表格的解析准确率有显著提高,同时,表格边框错误的问题也得到了优化。
注意事项:
切边矫正的能力存在上限,并不能完美解决所有照片歪曲的问题,如有可能,建议尽量保证输入图片的质量,有需求的用户请在后台联系我们,获得内测名额。
评论