登录注册
华为新概念?华为云取得图像结构化数据提取专利
韭研工具人
航行五百年的公社达人
2023-12-12 23:34:30

12月12日消息,华为云取得图像结构化数据提取专利,实现端到端的结构化数据提取。

专利摘要:本申请提供了一种从图像中提取结构化数据的方法,涉及人工智能领域,包括:输入图像至结构化数据提取模型,根据结构化数据提取模型获得图像的文字位置信息集合、文字属性信息集合和文字内容信息集合,根据至少一个子图像在图像中的位置、至少一个子图像中的文字的属性和内容,确定图像中的结构化数据。

上述结构化数据提取模型为由一个训练数据集训练获得的神经网络模型。如此,实现了端到端的结构化数据提取,避免了通过至少两个模型进行结构化数据提取导致的准确度不高、计算资源消耗大、花费时间长的问题。

从底层做个大模型有两个关键点:一个是算力,一个是数据质量。

算力的大小直接限制参数的大小,数据的质量决定了模型的好坏。

数据包括结构化数据和非结构化数据,在大模型训练中,通过对数据进行结构化处理,包括地域信息、文本信息、内容分类等处理,可提到信息的可靠度,能生成比较好的回答。

相关个股:

海天瑞声:公司的主营业务从事AI训练数据的研发设计、生产及销售业务。公司的主要产品有数据资源定制服务、数据库产品、数据资源相关的应用服务。

零点有数:公司在利用云算力、汇聚算量、聚焦关键领域的垂直算法开发方面均有积极作为,公司依托数据治理和算力基座建设基础,着力推动城市治理和政务服务垂直应用算法中心建设和决策脑核建设。公司主要依托公共云或私有云进行算力支撑,公司与国内知名云服务商都有云算力合作,也是华为昇腾的认证合作伙伴。

千方科技:2022年6月千方科技在投资者互动平台表示,千方科技在云存储方面布局良久,硬件产品系列从磁盘到SSD高端固态硬盘、从通用云存储到更加适用AIoT领域的专属存储到基于IMOS架构的存储管理服务器,都处于行业先进水平,支持包括国资云在内的云服务商的迅速部署和尤其是对视频、图片和结构化数据的统一便捷管理。

拓尔思:公司正在积极推进自身数据采集、标注、存储、传输、管理、应用等全生命周期价值管理,加强公司在政府、媒体、金融、产业大数据等重点行业的数据应用模式探索,深化数据驱动的全流程应用。公司在政务服务领域,已经帮助各级政府部门建立了多个政务大数据应用。

三维天地:公司的数据资产管理平台以“数据资产价值释放”为核心目标,覆盖DAM全域的10个数据管理职能,打通数据全生命周期的治理、开发环节,同时以知识图谱技术、机器学习、深度学习算法为智能化手段,解决企业中关键核心数据不可信、不可用、数据价值无法释放等痛点问题。

思特奇:公司基于国家构建全国统一大市场、全业务场景的数据要素交易、数字经济产业发展,催生智慧城市全新服务模式,以政府公共服务、城市治理、数字经济发展、产业互联协同等方面数据为核心,主打“数据共享”、“集约建设”、“数据赋能”的智能基础平台,推动“智慧城市中枢中台+数据和赋能服务+运营”的新业态,在更宏观的城市群发展中将不断得到深化。

测绘股份:公司作为专业的地理信息技术服务提供商,主要利用时空信息的现代专业测勘方法、先进的数据处理技术以及信息化技术,为建设工程、城市精细化及智能化管理、空间位置信息的行业应用提供包括地理信息数据采集、加工处理、集成服务等在内的专业技术服务。

海量数据:公司作为行业领先的数据产品和技术服务提供商,主要针对关系国计民生、国民经济的关键领域用户的数据中心, 搭建数据基础设施平台,为客户提供数据库、数据计算、数据存储相关的产品和服务。

作者利益披露:转载,不作为证券推荐或投资建议,旨在提供更多信息,作者不保证其内容准确性。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
海天瑞声
S
零点有数
工分
5.94
转发
收藏
投诉
复制链接
分享到微信
有用 5
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
暂无数据