文本图像中表格key-value信息的提取方法及装置
实质审查的生效
摘要
本申请涉及图像处理技术领域,特别涉及一种文本图像中表格key‑value信息的提取方法及装置,其中,方法包括:识别文本图像中的表格单元格位置信息;根据表格单元格位置信息和单元格内容信息构造单元格特征,并利用机器学习分类算法得到key‑value的MAP图;利用key‑value的MAP图将每个表格单元展开为一维链路,并构建动态规划,获取最优的key‑value从属关系路径,基于最优的key‑value从属关系路径获取表格key‑value信息。由此,解决了相关技术中基于模板和规则提取key‑value信息,通常需要设置繁琐规则或阈值,操作复杂、鲁棒性较差,且适用性较差及提取的准确性较低等问题。
基本信息
专利标题 :
文本图像中表格key-value信息的提取方法及装置
专利标题(英):
暂无
公开(公告)号 :
CN114495144A
申请号 :
CN202111599279.6
公开(公告)日 :
2022-05-13
申请日 :
2021-12-24
授权号 :
暂无
授权日 :
暂无
发明人 :
段静文张世锋汪一鸣
申请人 :
新奥新智科技有限公司
申请人地址 :
河北省廊坊市中国(河北)自由贸易试验区大兴机场片区廊坊临空经济区航谊道自贸区科创基地2101
代理机构 :
北京清亦华知识产权代理事务所(普通合伙)
代理人 :
黄德海
优先权 :
CN202111599279.6
主分类号 :
G06V30/414
IPC分类号 :
G06V30/414 G06V30/413 G06N20/00 G06K9/62 G06V10/764
法律状态
2022-05-31 :
实质审查的生效
IPC(主分类) : G06V 30/414
申请日 : 20211224
申请日 : 20211224
2022-05-13 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载