登录注册
次新股基本面之:星环科技【2022年9月30日申购】
股痴谢生
2022-09-29 11:22:21

一、主营业务

公司是一家企业级大数据基础软件开发商,围绕数据的集成、存储、治理、建模、 分析、挖掘和流通等数据全生命周期提供基础软件及服务,已形成大数据与云基础平台、 分布式关系型数据库、数据开发与智能分析工具的软件产品矩阵,支撑客户及合作伙伴 开发数据应用系统和业务应用系统,助力客户实现数字化转型。

从整个信息技术产业技术栈层次来看,信息系统主要由基础硬件、基础软件和应用 软件等部分组成,其中以操作系统、数据库、分布式系统、中间件、编译器等为代表的 基础软件在信息系统中承担基础性作用。公司专注于分布式技术、数据库技术、SQL 编译技术、数据云技术等基础软件领域的研发,致力于解决采用传统集中式软件架构的 信息系统所面临的大数据处理难题,为企业提供处理海量规模、快速流转和多样化类型 数据的大数据处理技术,帮助用户发掘数据价值。通过自主研发,公司已实现多项技术 突破,截至 2022 年 6 月 30 日,公司已获授权境内专利 77 项(其中发明专利 74 项)及 境外专利 8 项。公司基于分布式架构的大数据基础平台、分析型数据库产品已达到业界 先进水平,相关产品已通过国际知名组织 TPC 的 TPC-DS 基准测试并通过了官方审计, 公司也是该基准测试自 2006 年标准发布以来,全球首个通过官方审计的软件厂商。公 司的实力获得国际知名分析机构的认可,2016 年 2 月,公司被 Gartner 选入数据仓库及 数据管理分析魔力象限,位于远见者象限,在前瞻性维度上优于 Cloudera、Hortonworks 等美国主流大数据平台厂商,是 Gartner 发布该魔力象限以来首个进入该魔力象限的中 国公司。2020 年,根据 IDC《MarketScape:中国大数据管理平台厂商评估,2020》, 公司在关键战略、关键能力等维度评价综合能力排名市场第四,是中国大数据管理平台 市场的领导者。2022 年 6 月,公司多个产品或子产品入选 Gartner 发布的《中国数据库 管理系统供应商识别指南》,在识别的 8 类数据库管理系统产品中,公司入选产品覆盖 其中 7 类,是覆盖超过 7 类或以上产品的四家厂商之一,以及覆盖多模数据库的四家厂 商之一。

公司积极参与信息产业国产化进程,成为大数据基础软件国产化的重要推动者之 一。报告期内,公司牵头承担了包括工信部《2020 年新兴平台软件项目-大数据平台软 件》、上海市《全栈型云平台产品研发及生态建设》等项目,得到项目主管单位的高度 认可。公司已助力金融、能源、制造、交通等行业多个客户实现了数据分析场景中部分 关键信息系统的国产替代,替代的对象包括传统关系型数据库 Oracle、IBM DB2、 Teradata,以及搜索引擎 Elasticsearch、大数据平台 Cloudera Data Platform、数据统计分 析软件 SAS 等多家国外主流厂商产品。

公司的软件产品化程度较高,可以在不同行业实现广泛布局和快速复制。公司产品 具备长期稳定的潜在需求,已在金融、政府、能源、交通、制造业等众多主要国民经济 支柱领域得到广泛应用。截至本招股说明书签署日,公司已累计超过 1,000 家终端用户, 且产品已落地以下知名机构或其主要分支机构,金融行业包括中国银行、浦发银行、浙 江农村商业联合银行等,政府领域包括上海市大数据中心等,能源行业包括中国石油、 南方电网等,交通行业包括中国邮政集团、郑州地铁等,制造业包括湖南中烟等。各领 域主要代表性客户的名称详见本招股说明书“第六节 业务与技术”之“四、发行人主 要产品及服务的销售情况与主要客户”之“(二)主要客户”。

2、公司大数据产品在数字化基础设施中的定位

数据作为跟土地、劳动力、资本、技术一样的生产要素,随着数字化转型的深入推 进,地位愈发凸显。原始数据通常存在质量差、价值密度低等问题,在经过采集和存储 后,通常需要再经过多次加工,包括但不限于治理、建模和分析挖掘等工作,才能达到 数据的规范化、资产化,实现数据的共享和流通,进而发掘数据的使用价值,再推动业 务的自动化和智能化,实现数字化转型。在从原始数据到数据资产化、价值化的过程中, 一般需要三层软件技术能力的支撑以构建数字化基础设施,实现数据管理能力:

最底层是基础软件,提供信息系统的基础能力,一般包括大数据基础平台、数据库、 数据中间件和数据科学平台等,对多种场景、多种来源、多种类型的源数据进行有效的 采集、储存、管理并提供相关开发平台和工具,统一管理业务中所需要的数据,让客户 在数字化转型时有坚实的数据和工具支持。基础软件是整个应用系统最终实现数字化的 技术基础,其技术水平也决定了对应业务应用系统的能力边界和创造数据价值的效率;

中间层是数据应用系统,构建在基础软件之上,包括数据湖、数据仓库、数据集市、情报搜索、数据共享流通平台等,可按照业务特性来整理和加工数据,为业务数字化提 供高价值、易用的数据和工具,满足用户各场景应用的数据需求,为业务部门开发业务 应用系统提供客观条件;

最上层是业务应用系统,包括为业务部门构建的数字化运营、数字化决策、智能制 造、数字营销、智能风控等应用系统,助力客户更加实时、准确地进行商业决策,提高 业务运营效率,并创造更优的解决方案等,从而将数据价值转换为业务价值,实现数字 化转型。

在数字化基础设施建设过程中,公司主要为客户提供数字化基础设施底层、中间层 的基础软件和技术服务,支持客户的技术团队及合作伙伴构建数据和业务应用系统,助 力客户进行数字化转型。

image.png

3、主要产品及服务

公司具体主要提供两大类的产品和服务:第一类是大数据基础软件业务,包含基础 软件产品和技术服务;第二类是应用与解决方案,主要针对大数据应用场景,提供大数 据存储、处理以及分析等相关场景下的咨询及定制开发等服务的解决方案;除上述两类 业务以外,公司根据客户及项目需求销售少量第三方软件、硬件等其他业务。

公司主要产品及服务体系如下:

image.png

(1)大数据基础软件业务

1)基础软件产品

公司基础软件产品包括三类,分别为大数据与云基础平台软件(TDH 和 TDC)、 分布式关系型数据库(ArgoDB 和 KunDB)、数据开发与智能分析工具(TDS 和 Sophon)。 公司基础软件产品主要以软件产品授权的方式交付,也可以软硬一体产品形式交付,并 根据项目需求配套提供相关的技术服务。

① 大数据与云基础平台软件

Ⅰ、大数据基础平台(TDH)

TDH 是公司自主研发的一站式大数据基础平台,包括多个大数据存储与分析产品, 能够存储 PB 级别的海量数据,可以处理包括关系表、文本、时空地理、图数据、文档、 时序、图像等在内的多种数据格式,提供高性能的查询搜索、实时分析、统计分析、预 测性分析等数据分析功能。TDH 是通用的高性能大数据平台,提供标准的 SQL 开发接 口,有着优秀的数据库兼容性,不仅可以帮助各个行业用户开发创新的数字化业务,还 可以替代关系型数据库提升当前业务的应用效能。目前 TDH 已经在政府、金融、能源、制造业等十多个行业内落地,支撑如金融风控与营销、智慧制造、城市大脑、智慧交通 等多种核心行业应用。

TDH 在 SQL 兼容性、分布式事务、数据处理性能、多模型数据处理、部署与运维 等维度上有较强的技术先进性。在 SQL 兼容性上,TDH 已经兼容大部分 SQL 99、SQL 2003 OLAP 标准;为了实现对国外关系型数据库的进口替代,TDH 也逐步实现了对 Oracle、IBM DB2 和 Teradata 等数据库 SQL 方言的支持,以及 Oracle PL/SQL、IBM DB2 SQL PL 等 SQL 扩展,是目前大数据领域对 SQL 标准支持较为完善的产品之一。从 2015 年开始,TDH 就已较早地在大数据行业中支持分布式事务,保证数据的一致性和准确 性,并将分布式事务处理能力用于数据仓库等核心数据业务系统中。TDH 采用容器技 术来部署、调度和管理,从而可以适配更复杂的异构硬件资源以及降低系统的运维难度, 是行业内较早实现基于容器技术管理大数据基础软件的产品。2018 年 3 月,TDH 5.1 成为全球第一个通过 TPC-DS 基准测试并经过 TPC 官方审计的数据平台。从 2020 年开 始 TDH 平台支持多模型数据统一分析技术,开发者可以使用 SQL 来统一分析在多个存 储引擎里面的数据,打通不同数据库之间的数据孤岛。

TDH 中包含了一系列大数据基础软件子产品以支持多种存储模型,主要包括实时 流计算引擎 Slipstream、关系型分析引擎 Inceptor、宽表数据库 Hyperbase、图数据库 StellarDB、搜索引擎 Scope、时空数据库 Spacture、时序数据库 TimeLyre、键值数据库 KeyByte、事件存储库 Event Store、数据科学平台 Sophon Discover,以及一系列保障平 台安全、稳定运行等企业级管理需求的子产品。TDH 产品软件架构及架构中主要子产 品具体介绍如下:

image.png

image.png

image.png

image.pngimage.pngimage.png

TDH 被广泛应用在离线数据批处理、高并发的在线数据服务、数据集市、数据仓 库、数据湖、文本搜索、图存储分析、空间数据存储、实时数据处理等各类大数据业务 场景,在金融、交通、政府、能源等多个行业积累了大量案例,可以替代 Oracle、IBMDB2、Teradata 等传统主流数据库在分析型场景中的应用及替代 Elasticsearch 在分布式 搜索场景中的应用。

应用案例:基于 TDH 的某邮政集团大数据分析平台项目

某集团基于Teradata和Oracle传统关系型数据库建设的企业经营分析业务与决策支 持系统,经过多年的运行后,存在存储空间不足、数据加工性能差等问题。为了更好的 支撑大数据分析类业务需求,该集团使用星环科技 TDH 产品来构建大数据平台。

首先,TDH 统一的多模型引擎可以存储和处理多种数据模型,解决了原有系统不 能处理大量半结构化数据和非结构化数据的问题。

其次,基于 TDH 构建的统一数据仓库集群,支撑了多源异构数据的整合,解决存 储空间不足和数据加工性能差的问题。TDH 提供的高性能数据分析处理能力,将数据 查询和分析效率提升了一个数量级。

第三,基于 TDH 的实时计算能力,支撑起实时的数据分析与加工,业务实时性得 到极大增强。

此外,TDH 统一的 SQL 引擎对于传统数据库的语法有较好的兼容性,可以降低业 务迁移成本,对现有经营分析业务与决策支持系统中的历史数据、数据模型、报表应用 等进行平滑迁移,上线后支撑单日数十万次高并发查询业务,实现混合高并发复杂查询 秒级响应。在 TDH 的良好性能和高可用的特性下,大数据平台成功替代了原有的系统 架构搭建完成了新的经营分析业务与决策支持系统。

Ⅱ、数据云平台(TDC)

TDC 是一款基于容器技术的数据云平台,支持将大数据基础平台、分布式关系型 数据库、智能分析工具等大数据软件以 PaaS 云服务的方式提供给客户,满足客户对数 据平台的多租户、弹性可扩展和使用灵活性的要求,可以在一个云平台上支撑大量的用 户需求和数字化应用,适用于建设大型企业的数字化基础设施、城市大数据中心的数据 平台、企业级数据应用云以及跨多数据中心的数据平台等场景。

TDC 是业内较早采用云原生技术来实现大数据产品的 PaaS 化,基于容器云技术实 现云平台的多租户能力,从而企业可按需将数据开放给不同的组织或部门,同时实现不 同租户之间的数据隔离、资源隔离和应用隔离,保证各个租户能够按需按量地基于大数据开展业务创新。

TDC 内置完善的企业级大数据产品,包括数据湖、数据仓库、搜索引擎、实时计 算、数据科学平台、分布式交易数据库等大数据云产品,满足用户在数据查询分析、数 据工程、数据科学、数据应用和数据共享交换等业务场景下的数据开发要求。同时基于 TDC 提供的应用市场、DevOps 工具集、API 网关、微服务治理等平台能力,可以支撑 用户业务应用开发与测试自动化流程,也可以将开发好的应用发布到 TDC 应用市场上, 利用 TDC 的微服务治理能力,保证应用服务的弹性和可扩展性。TDC 能够支持 X86 与 各种国产芯片架构,以及 CentOS、RedHat、Windows Server、UOS、麒麟等国内外主 流的操作系统,也支持同一集群内采用多种不同 CPU 的混合架构,可以帮助用户逐步 进行国产化软硬件的升级改造。基于自研的联邦云技术,TDC 可灵活采用物理机、私 有云以及混合云部署,也可以统一管理在多个数据中心的数据平台,适用于有多个数据 中心的企业或政府客户。

TDC 产品软件架构及主要子产品具体介绍如下:

image.png

image.png

image.pngimage.png

作为行业内较早实现大数据基础平台和分布式关系型数据库云化服务的产品,TDC 已经帮助政府、银行和大型企业构建多个数据云相关的系统,帮助用户完善普惠化、自 助化的数据基础设施构建。

应用案例:TDC 为上海市大数据资源平台提供重要数据云计算环境

TDC 在上海市和区两级政府的数字化建设中发挥了重要作用,被大量应用于“一 网通办”的核心系统中,助力上海市政府建设“两中心、两体系、四中台”的数字化政 府“两网”,赋能城市级数据中心建设。在上海市大数据中心,TDC 一是为市大数据资源平台提供了重要数据云计算环境,支撑全市数据的归集,为自然人综合库、法人综 合库的数据治理工作提供多样化存储和计算能力;二是为上海市大数据资源平台保障对 外服务的时效性、可靠性和健壮性,提供的多租户资源隔离能力,提升上层数据应用的 安全性,例如:各责任单位基于多租户能力在城市数据湖中进行数据管理、各需求单位 基于多租户能力开展在线查询业务等;三是基于 TDC 应用开发平台的能力打造具备 “高频”“高并发”能力的数据接口服务,为“一网通办”“随申办”等关键应用提供 数据支撑,实现“数据多跑腿、群众少跑路”。

②分布式关系型数据库软件

关系型数据库主要用于存储和处理结构化的数据,按照应用场景不同可以分为交易 型数据库和分析型数据库。交易型数据库主要用于对数据进行高并发的“增、删、改、 查”操作,对数据实时性、一致性、可靠性和安全性要求高,主要用于与业务操作强相 关的事务型场景,如银行转账、电子商务、企业内部 ERP 系统等。分析型数据库是面 向分析应用的数据库,主要对来自交易数据库或其他数据源的历史数据高效地进行批量 加工处理和交互式查询分析,如企业内部数据决策分析、数字化运营等。

多年以来,以 Oracle、IBM DB2 为代表的国外传统集中式关系型数据库长期占据 数据库市场的主要份额,被广泛应用于我国各行业的核心信息系统之中。此类集中式数 据库通常运行在预配置的专用设备上,且存在容量限制,可扩展性较差,只能通过更换 高性能的硬件设备(纵向扩展)来改善数据库性能,不能通过简单增加硬件设备的方式 来提升性能(横向扩展),无法适应大数据时代数据快速增长的存储和处理需求。

随着分布式技术的兴起,新一代基于分布式技术的数据库凭借着技术与架构的先进 性,能够在性能和可扩展方面逐步超越传统集中式数据库。公司采用新一代的分布式技 术,自主研发了分布式分析型数据库 ArgoDB 和分布式交易型数据库 KunDB。

Ⅰ、分布式分析型数据库(ArgoDB)

ArgoDB 是面向数据分析型业务场景的分布式闪存数据库产品,主要用于构建离线 数据仓库、实时数据仓库、数据集市等数据分析系统。2019 年 8 月,ArgoDB 成为全球 第四个通过 TPC-DS 基准测试并经过 TPC 官方审计的数据库产品。

ArgoDB 主要的技术特点包括:

image.png

image.pngArgoDB 的主要应用场景具体包括:

image.png作为公司自主研发的数据库,ArgoDB 注重与国产软硬件生态的兼容,已经完成和飞腾、鲲鹏等国产硬件及麒麟、UOS 等国产操作系统的深度适配。ArgoDB 兼容 Oracle、 IBM DB2、Teradata 数据库对 SQL 语言的扩展,可以在数据仓库场景中替代国外分析型 数据库。

应用案例:某农商行基于 ArgoDB 构建新一代数据仓库

某农商行是当地规模最大的商业性地方金融机构,行内原基于 Oracle 数据库建设 业务系统。随着行内在移动互联渠道提供的客户服务逐渐丰富,客户点击流量增长快速, 客户的体验要求也在提高,对数据库的查询和分析能力也提出了较高要求。原 Oracle 数据库在业务支撑能力方面有以下问题:a)随历史数据不断增长,现存统一收单系统 的交易明细查询结果输出缓慢,无法快速精确查询到相关交易;b)银行业务需要实时 统计分析用户的相关信息,改进业务质量和产品的服务水平。基于 Oracle 的复杂分析 能力的欠缺在业务中的掣肘愈发明显,且经常出现数据加工延迟的情况;c)Oracle 以 交易型业务为主,分析型业务挤占交易业务的资源,给日常业务的稳定性带来隐患;d) 支撑场景单一,无法满足诸如基于实时数据处理等的创新型业务。

基于星环科技统一架构的 ArgoDB 平台,支持满足仓集一体、实时数仓等建设需求, 同时具备完整的 SQL 及 PL/SQL 支持。通过支持 Oracle 方言,极大降低了 Oracle 数据 库业务数据和现有分析型业务的迁移成本。在分析型业务方面以更低成本、更高性能完 整替代了传统 Oracle 数据仓库,确保分析型业务与交易型业务的隔离。

平台满足了行内包括历史明细数据查询、交易流水查询、实时交易大屏、大额交易 提醒等十多个关键查询业务场景需求。平台针对各类分析型业务的自动性能优化,保障 了多用户高并发场景下的性能要求。平台结合实时流引擎 Slipstream,将源数据库 Oracle 的增量数据以秒级延时快速同步到 ArgoDB 实时数仓,尤其确保了对源系统数据有删改 的经常性调账退款业务数据能即时反映在分析系统中。平台基于实时落库的业务数据实 现了多流水表多维度数据整合的交互式复杂分析能力,将原本基于 Oracle 的离线级分 析能力提升到秒级的准实时级交互式分析能力,为行内未来多种复杂的分析型业务应用 的拓展与更高的实时性要求打下坚实的技术基础。

Ⅱ、分布式交易型数据库(KunDB)

KunDB 是公司研发的一款面向数据操作场景的分布式交易型数据库,主要用于支 持操作型业务场景(如 ERP、OA、HIS 等)和高并发场景(如消费者的手机 APP 应用、健康码查询等)的核心数据系统的构建。2021 年 12 月,KunDB 在中国人民银行下属 北京国家金融科技认证中心标准符合性检测中表现较为优异,在包含分布式事务能力、 分布式数据存储、服务高可用、扩展性和运维管理等能力的 337 项检测中通过率达 91.39%。

KunDB 主要的技术特色包括:

a)良好的 SQL 语法兼容:支持 SQL 99 标准(包括语法和各类数据库对象及数据 类型等),兼容 MySQL 和 Oracle 语法(包括 Oracle PL/SQL 语法),能有效降低业务 系统开发和从其他数据库迁移的成本;

b)可扩展性:KunDB 采用计算和存储解耦合设计,存储层支持水平分片,可以通 过增加节点按需扩展分片,同时计算可下推到存储层,实现性能提升。分布式的架构可 以保证通过增加新的硬件资源来线性地提升数据库的存储能力和计算性能;

c)高并发的分布式事务:自研分布式事务管理技术,通过自研的全局事务管理器 GTM、2PC 协议等技术保证高并发的全局 ACID,单节点每秒可达上万个事务吞吐量;

d)全套的安全管理措施:提供数据库用户认证、授权、鉴权、权限管控,以及系 统操作审计、SQL 审计、安全审计,提供数据存储加密、链路通信加密能力,能够防 止 SQL 注入,也支持国产加密算法对整库数据做透明加密;

e)独特的混合部署技术:支持 X86 与各种国产芯片架构,以及 CentOS、RedHat、 UOS、麒麟等国内外主流的操作系统,能够运行在异构 CPU 架构以及多种操作系统混 合部署的集群环境中;

f)云化服务能力:KunDB 使用容器技术支撑,并与星环 TDC 平台做了深度的优 化和整合,能够在星环数据云平台上以云数据库的方式提供服务,可以让用户按需创建 数据库服务、根据业务需求来实现弹性的扩缩容、自动化的运行时监控等;

g)高可用和灾备能力:支持故障时的立即切换,能提供 7X24 小时连续服务保证。 提供灾备和恢复工具与机制,并结合业务情况提供数据灾备解决方案。

KunDB 适合的业务场景主要包括:

image.pngimage.png应用案例:基于 KunDB 的某央企省公司综合运营管控平台

某能源行业央企省公司的综合运营管控平台支撑了该公司原材料的采购、配置、调 运和结算等业务流程,是日常业务运营及管控的重要系统。该平台利用 KunDB 作为后 端 OLTP 数据库,实现平台新业务的快速开发上线。关联业务存储在 Oracle 系统的存量 数据全量迁移到 KunDB 中,并且通过数据同步组件,每天从该 Oracle 数据库中实时同 步相关增量数据到 KunDB 数据库中,支撑综合运营管控业务系统,日均处理百万行数 据,并提供查询服务。KunDB 上线后,为企业关键运营流程的正常运转,以及综合运 营指标处理和实时展现提供了有效支撑。

Ⅲ、分析型数据库及交易型数据库联合应用

为了满足多种业务场景,企业通常需要同时使用不同部门的数据,并同时需要对数 据进行实时处理和复杂分析。由于交易型数据库和分析型数据库在数据存储和计算处理 方面的较大差异,单一的数据库无法满足上述业务场景,需要使用多种类型的数据库。 通常的数据库联合应用方案只是在数据应用层做了统一,而没有在数据库层统一,数据 库间数据同步会有时延,并且数据库之间的数据一致性往往无法保证,难以满足业务需 求。

KunDB 和 ArgoDB 的联合应用方案,凭借着公司统一的 SQL 引擎架构优势,在数 据库层做了深入的融合。在数据层面,KunDB 与 ArgoDB 之间基于数据库日志实时数 据同步,操作型业务在 KunDB 中产生的新数据将实时同步到 ArgoDB 中,保证两个数 据库中的数据实时一致;当一个新的业务 SQL 提交到 Transwarp Quark(SQL 编译器) 后,Quark 内置的优化器可以根据业务特点选择合适的数据库来执行该业务 SQL,提供 最佳的性能表现。

image.png

应用案例:某医院数据中心的信息系统建设

某三甲医院基于星环分布式关系型数据库 ArgoDB+KunDB 搭建了新一代临床数据 中心。基于 ArgoDB 的多模型数据处理能力,临床数据中心实现了对不同临床数据的统 一存储和一站式数据查询、分析和展现。在原系统中,医务人员诊断时需要切换到各个 系统里查询不同临床数据,如医嘱、病历、检验、心电、超声、病理等,操作复杂。在 新一代临床数据中心中,多个系统的不同类型数据被统一采集、存储至 ArgoDB,数据 经过加工处理后,部分结果导入到 KunDB。医务人员可以通过一套系统查询各类临床 数据,大大简化了操作流程,提升了临床工作效率。同时医务人员还能对病患的过往临 床数据进行历史趋势查询,如观察某病患在过去 10 年中多次血常规指标的情况,为诊 断提供了更多数据支撑。目前该数据中心已完成所有历史数据的抽取,包括就诊记录、 诊断记录、检验记录、药物医嘱、影像资料等近百 TB 数据,同时还支持峰值每秒数十 万条数据的实时写入与更新。

ArgoDB+KunDB 的联合使用不仅完成了对实时数据的建模与加工,还可以提供实 时数据决策分析及诊断信息查询。医院经常需要统计各类医疗资源当前使用情况,如各 科室病床使用、就诊患者数量以及药品库存数量等信息。由于查询字段灵活不固定,原 系统在处理复杂查询时,无法通过预建索引优化,查询性能无法满足需求。通过新一代 临床数据中心,医院运营人员无需提前建立索引,可以自助实现多维度任意字段的查询,如“诊断=糖尿病;用药=吡格列酮;糖化血红蛋白>7”可在 2 秒内返回查询结果。运 营人员通过高效完成各类报表信息的统计,快速掌握了当前各类医疗资源的使用情况, 并及时进行调配,提高了医疗资源的利用率。

③数据开发与智能分析工具软件

Ⅰ、大数据开发工具(TDS)

TDS 是公司研发的一款用于大数据开发的工具集。TDS 内置多个数据工具产品, 为企业构建数据仓库、数据湖、数据中台,提供高效的数据集成、数据治理、数据资产 管理、数据标签与服务、数据共享与交易等工具,提高开发者对数据系统的建设效率, 提升业务客户对数据资产的利用效率,帮助客户实现数据对业务的赋能。

TDS 基于分布式架构的设计,能够提供日百万级数据任务的调度和执行,能够快 速整合或同步多个数据源的数据到大数据基础平台中,支持数据管理人员高效地设计数 据标准和数据质量规则,利用大数据基础平台的计算能力来改进数据质量、关联业务规 则,从而将数据资源转化为数据报表、数据标签、数据指标和数据 API 服务等数据资 产,为业务部门所用,帮助用户建立企业级数据治理和数据资产平台。TDS 也提供数 据安全防护的能力,提供自动化的敏感数据发现、数据分类分级管理、数据脱敏等能力, 保障数据收集、存储和流通环节的安全。TDS 不仅能够管理公司自研的大数据基础平 台内的数据,也可以管理多个关系数据库和外部大数据平台,帮助用户屏蔽掉底层数据 架构的复杂性。TDS 的产品软件架构及架构中主要子产品如下图所示:

image.png

image.png

image.png

image.png

应用案例:某能源集团基于 TDS 构建的全国加油站销售指标体系

某能源集团从 2019 年开始建设全国加油站销售指标体系,从预算分析、运营管理、 风险监控、决策支持、考核评价 5 个方面共设计了 2,000 余项指标,并将数字指标广泛 应用在物流调配、消费券发放、内部经营管理等经营活动中,提升油气销售业务的数字 化和经营效率。

在该体系建设过程中,该集团用户使用 TDS 有效提升了数据开发效率,通过 TDS 的数据集成能力整合了集团内加油站的基础数据(包括油品和非油品销售数据,会员信 息,开票信息等),通过数据治理能力将数据加工成数据资产,并最终构建了销售指标 体系门户,为零售、批发、物流、财务等业务部门提供高价值的数据服务。TDS 平台 上每天运行的数据开发任务达数十万个,支撑的数据规模也达到 PB 级别。

Ⅱ、智能分析工具(Sophon)

Sophon 是一款一站式人工智能平台,包含一系列数据分析与机器学习建模工具的 智能分析工具软件,涉及数据分析中的计算智能(读取、计算)、感知智能(看、读、 认)、认知智能(理解、认知、思考、推理)以及行为智能(决策)四个主要方向。Sophon 能够一体化地完成数据采集、数据接入、模型构建、模型测试、模型管理、知识存算和 推理以及辅助决策流程,支撑各类业务的数据分析、探索与服务。通过 Sophon 内置的 统计算法、机器学习算法和深度学习算法,用户能够更高效地进行大规模复杂数据分析 和预测性分析,从而辅助业务决策,提高企业的数字化运营能力和智能化决策能力。

Sophon 产品主要特点包括:

a)覆盖数据分析建模全流程:支持从数据接入、数据标注、数据预处理、特征工 程,到模型训练、服务部署、线上监控和模型管理的一站式图形化开发流程,支持容器 化部署与弹性资源管理,提供跨平台、边缘设备等模型部署能力

b)支持多模态数据集成、融合和知识推理:提供的知识图谱模块用于多种来源及 不同类型数据的分析以及复杂信息的抽取、融合和推理,提供大规模异构数据的图谱工 具,并支持高性能的深度图算子和计算框架,提升复杂关联关系场景下的隐匿信息挖掘 能力;

c)拥有隐私计算功能:提供大数据交换时的数据安全,保护个人数据隐私和商业 机密。在保证合法合规的前提下,支持多参与方或多计算结点之间开展高效率的数据建 模分析,支持横向、纵向和迁移学习的联邦学习框架,以及同态加密、差分隐私和不经 意传输加密协议;

d)提供数百种分布式机器学习算法:分布式机器学习覆盖数据分析中的计算智能 (读取、计算)、感知智能(看、读、认)、认知智能(理解、认知、思考、推理)、 行为智能(决策)四个主要方向,产品内置了超过 200 种分布式算法,覆盖了通用的机 器学习和深度学习算法;

e)提供边缘计算能力:实现边缘端视频和物联网标准协议接入互通;可以使用低 代码方式定义视频处理、机器学习模型分析、处理规则等;支持云端、边缘端统一管理 部署;通过算法市场,提供设备检测、OCR 等场景的基准算法和模版;在嵌入式设备 和服务器的不同硬件条件下,有针对性地提供模型预测优化,提升标准解决方案性价比;

f)提供分析即服务的能力:支持私有云、公有云和混合云部署模式下分析即服务 的能力。

image.png

image.png

客户可以基于 Sophon 产品提供的机器学习模型算子,进行数据预处理、特征工程 和模型训练,能够在各规模数据量上完成模型的训练、验证和检测过程;对非结构化、 半结构化数据进行知识抽取,并融合其它数据分析产生的复杂关联的知识,进行进一步 的提取、融合、存储和推理;能够对接多种数据源,也可以在嵌入式边缘端设备上智能 采集数据并针对如 OCR、工业异常检测、可预测性维护等标准场景提供基准分析和服 务;自动化部署训练好的机器学习模型到云端或边缘设备上,并进行统一的管控和模型 运行维护;可以让业务人员自定义业务流程和规则,并发布为标准接口,同时可以持续 观测业务运行的效果,进而指导算法迭代并推动业务演进。

应用案例:某银行基于 Sophon 的反欺诈系统

随着银行业务量和业务种类的快速膨胀、实时性要求愈发的高、多种业务以及信息 的融合越加丰富,银行信息系统也愈加需要智能化和体系化。以某银行为代表的智能反 欺诈实例中,该银行采用 Sophon 机器学习平台进行数据分析处理、模型开发及模型评 估和测试,搭建了毫秒级实时响应、自动化模型迭代、智能化模型应用为一体的反欺诈 机器学习智能识别模型。其中,使用 Sophon KG 对多种业务系统来源风险源数据(例 如结构化的交易数据和非结构化的文本数据)进行融合,以及交互式的业务洞察,充分 使用图计算进行复杂关联关系查询,探查可能的未覆盖风险;使用 Sophon Base 的大数 据对接能力和 200 余种内置分布式机器学习算子,通过有监督、半监督和无监督的分布 式算法对存量业务数据进行回溯性分析、根因分析和预测性分析,同时结合数据探索以 及知识图谱提供的风险线索,灵活使用代码建模和拖拉拽式低代码建模模块,快速搭建 风险量化模型并加以调优、验证和模型监测;通过 FIDE 将机器学习模型打包发布成 API 接口调用服务,为风控业务提供实时决策服务,对潜在的欺诈客户进行实时拦截, 从而降低银行的资金风险,同时满足了金融风控业务的高召回、低延时、高并发需求。 基于 Sophon 机器学习平台开发的反欺诈机器学习模型提升了银行关键业务场景的反欺 诈监测、识别和处理的能力。

Ⅲ、基于隐私计算技术的数据要素流通工具集

随着数据作为生产要素地位的确定,个人及企业自身的数据风控需求和法律法规的 合规要求推动数据流通技术进一步推陈出新。公司基于 TDS 和 Sophon 的多个产品打造 了星环数据要素流通工具集,包括数据商城 Foresight、隐私计算平台 Sophon FL、安全治理产品 Defensor 和数据审计产品 Audit。该工具集能够为数据资源方和数据消费方提 供一系列的数据安全防护和隐私计算的能力,在各方数据不出域的前提下,提高数据流 通参与方在数据存储、传输、发布、分析和联合建模等各个环节的安全保障。

image.png

在该工具集中,数据安全防护产品 Defensor 提供了数据的安全分类分级、数据脱 敏、数据加密、数据水印、敏感数据发现等数据安全管理能力;隐私计算产品 Sophon FL 提供了隐私查询、隐私求交、联邦特征工程、横向/纵向联邦学习、联邦数据质量和模 型质量评估等功能,实现 “数据可用不可见”的效果;数据商城 Foresight 提供数据发 布、审核与审批功能,让数据需求方可以方便地完成数据资源的发现、申请和使用;数 据审计工具 Audit 则提供各个系统间数据流转的动态安全防护能力,能够感知敏感数据 泄露和异常数据操作行为,并根据安全策略来执行阻断行为。

该工具集的技术特点包括:

a)数据流通过程中端到端的安全防护:使用 Defensor 的安全防护能力,对流通的 数据采用动态脱敏、透明加密等方式实现隐私保护,使用 Foresight 对数据发布和申请 流程进行审批和管控,利用 Audit 工具对数据流通过程中的可能的异常行为和数据泄露 进行阻断;

b)基于密码学保障的分布式隐私计算技术:使用了差分隐私、混淆电路、同态加 密、不经意传输、掩码技术、机密计算等隐私计算技术,结合公司高性能的分布式算法, 可以在海量密文数据上运行分布式机器学习算法,实现“原始数据不动模型动”、“数 据可用不可见”的效果;

c)基础安全隔离技术: 结合公司 TCOS 的容器安全技术,通过网络隔离、容器隔离、应用动态扫描等方式,可以在主机层、数据平台层和数据资源层都实现安全隔离和 应用安全加固。

从交付方式上,报告期内公司大数据与云基础平台软件、分布式关系型数据库、数 据开发与智能分析工具三类大数据基础软件产品主要以软件产品授权的方式交付。少量 情况下,根据客户需求,公司通过软硬一体方式交付,即将自研的大数据基础软件产品 安装到公司定制的服务器硬件中,形成软硬一体产品进行交付。针对企业级数据中心场 景,公司主要搭载 TDH、TDC、ArgoDB、Sophon Base 及相关定制的服务器硬件,形 成超融合大数据一体机;针对边缘计算场景,主要搭载 Sophon Edge 及相关定制的服务 器硬件形成智能识别一体机。公司的一体机可兼容业界主流操作系统和国产操作系统, 通过提高软硬件的集成度,满足市场对软硬件一体化、端到端的产品需求。同时,根据 项目具体需求,公司在提供软件或软硬件一体产品时会配套提供相关的技术服务,包括 迁移服务、平台咨询规划、数据平台建设、专家诊断与优化等,以产品加服务的组合形 式向客户进行交付。通过以上灵活的交付组合,满足了客户多样化的 IT 建设需求,有 利于公司提升软件的市场份额。

2)技术服务

由于大数据基础软件专业性较强且对于整个信息系统的重要性较高,需要提供技术 服务支持。结合客户需求,公司建立了相应的技术服务标准和服务等级,提供针对性的 技术服务。公司具备较强的技术服务能力:

2020 年,公司通过中国信息通信研究院“数据库服务能力评估-实施部署专项-量化 管理级(四级)”,是当年公布评级中的最高评级,表明公司在数据库服务能力方面已 具备较高的成熟度;

2021 年,公司通过中国信息通信研究院“大数据服务能力评估-大数据平台建设服 务能力专项-量化管理级(四级)”,表明公司在大数据服务能力方面已具备较高的成 熟度。

公司提供的技术服务内容主要包括:

①公司产品相关的安装部署、售后维保服务、产品升级、数据备份;

②帮助合作伙伴开发者和客户利用新技术和产品构建新业务的培训服务;

③基于客户现有系统,为客户提供平台咨询规划、数据平台建设、技术开发服务, 进行迁移改造或系统优化,以及提升客户数字化运营与决策生产效率的专家诊断服务;

④针对平台运维与运营,监控产品平台的关键指标,解决平台运行过程中问题,优 化平台效率,保障平台稳定性,提高业务连续性等数据平台运营服务。

相关技术服务具体工作内容如下:

image.png

image.pngimage.png

(2)应用与解决方案

用户可应用大数据进行数字化转型及价值发掘的场景众多,潜在需求较大,但由于 相关领域较新、技术专业性较强,用户对如何运用大数据构建相关信息系统希望得到专 业的建议和支持。为了协助用户理解大数据信息系统的使用功效及搭建相关大数据应 用,针对一些特定应用场景,公司提供大数据存储、治理以及分析相关的咨询、定制开 发等服务的解决方案。在解决方案的服务实施中,公司可以搭配自身产品进行销售,并 通过为用户解决问题,进一步推广公司产品、树立行业示范标杆,产生业务价值。2020 年,公司获得了中国信息通信研究院“大数据服务能力评估-数据工程专项-量化管理级 (四级)”,表明公司在数据治理服务能力方面已具备较高的成熟度。

公司提供包括数据应用解决方案和业务应用解决方案,具体如下:

image.png

数据应用解决方案可通用于各行业,主要面向用户信息技术部门内部技术人员。公 司通过针对客户的多种数据源,提取数据并进一步治理、归集、分析,形成数据仓库、 数据集市等可用性较强的数据服务,同时产生可用性较强的数据也可以为搭建业务应用 系统提供支撑。

业务应用解决方案通常针对于特定的行业场景,主要是面向用户的业务人员,针对 于客户的业务场景,运用公司优势技术能力,解决业务数字化过程中的关键难点,构建 相关业务应用系统。

1)数据应用解决方案

image.png

数据应用解决方案可通用于各行业,主要面向用户信息技术部门内部技术人员。公 司通过针对客户的多种数据源,提取数据并进一步治理、归集、分析,形成数据仓库、 数据集市等可用性较强的数据服务,同时产生可用性较强的数据也可以为搭建业务应用 系统提供支撑。

业务应用解决方案通常针对于特定的行业场景,主要是面向用户的业务人员,针对 于客户的业务场景,运用公司优势技术能力,解决业务数字化过程中的关键难点,构建 相关业务应用系统。

1)数据应用解决方案

公司根据企业数据体系的现状和需求,提供基于公司产品的数据平台、数据治理、 业务分析与智能等系列解决方案。数据应用系统通常面对的适用对象为用户内部技术人 员,为搭建业务应用系统提供支撑。具体情况如下:

image.png

image.png

应用案例:某农商行数据仓库解决方案

某农商行自 2012 年起建设了基于 Teradata 的数据仓库,随着业务发展,数据规模 不断扩大,数据应用增加,基于 Teradata 的数据仓库所承接的源系统数据越来越多,平 台现有的功能较为单一、整体数据处理效率低下、难以与更多数据源及系统对接,导致 功能拓展困难,无法满足日益增长的复杂业务及开发维护升级的需求。

在该农商行数据仓库解决方案中,针对客户现状进行数据/体系架构设计,在原有 系统基础上提出了优化方案。在新数据仓库系统中,公司搭配销售了分布式分析型数据 库 ArgoDB 和大数据基础平台 TDH,不仅支持 SQL 99/2003 标准语法,并且完整兼容 原 Teradata SQL 语法,方便开发人员熟悉使用。在原有基于 Teardata 的数据仓库整体迁 移到星环科技大数据基础平台过程中,公司协助农商行完成了临时数据层迁移、操作镜 像层迁移、临时历史层迁移、基础模型层迁移、汇总层迁移、应用集市层/视图迁移等 迁移工作,制定并落实数据标准管理办法及流程、数据质量管理办法及流程、元数据管 理办法及流程、配套管控系统功能模块设计与实现,完善整个数据管控与治理体系,完 成了数千张数据表、近万个脚本、近千个数据服务接口的完整迁移,推动了该农商银行 的大数据战略实施。公司的数据仓库解决方案从根源上解决了该农商行在数据仓库领域 存在的问题,提升银行对业务发展的数据支撑能力。

2)业务应用解决方案

为促进新技术产品在特定行业客户的推广,公司依托自研的大数据、数据库等核心 软件产品,针对特定业务场景需求提供行业应用解决方案。公司通过行业业务与应用解 决方案了解客户需求,解决客户痛点问题,建立示范标杆,进而带动更多客户采用公司产品。目前,公司已在金融行业提供了金融风控解决方案与量化投研解决方案,在教育 行业提供了科研与教学平台解决方案。

image.png

应用案例:某银行小微金融智能风控解决方案

小微金融智能风控为当前银行的战略方向之一,相对于个人客户或中大型法人客 户,小微企业信息缺失严重且生命周期短,行业缺少有效的风险评价标准;且小微企业 风险经常与其法人风险、供应链风险、行业风险形成复杂关联,针对小微企业风险的精 确动态量化和违约概率预测较为困难。

公司从小微企业和与其相关的舆情事件角度出发,通过风险事件库、企业关联关系、 专家规则制定、模型算法等方式,构造十余种关系类别,为某银行构建了风险事件关系 图谱,实现基于企业间关联关系的风险事件传导分析和风险影响预测。公司搭配销售了 分布式图数据库 StellarDB 产品,在进行图补全和计算时具有较好处理性能,能够融合 更多维的企业和事件风险决策、计算和推理。在系统上线后,针对缺失有效风险信号的 客户进行风险提前感知预测,辅助客户经理和风险经理进行定向风险排查,有效对可能 还款能力变弱的客户进行风险问题预测提示。

(3)其他业务

其他业务系公司在为客户提供大数据产品或服务时,特别是为大中型客户数字化改 造等项目中根据客户需求,为客户配套外采第三方软硬件产品并销售给对方的业务,该 类业务为信息技术产业的常见业务类型,主要包括服务器、第三方商业智能软件等,该 业务占公司收入比重较小。

4、公司技术发展历程及产品演变情况

自成立以来,公司以大数据基础平台软件为切入点,并逐步发布相关新的软件产品 来完善公司的大数据产品矩阵,不断丰富的产品系列为客户提供数据全生命周期的高效 管理工具。

公司技术发展历程及产品演变历程如下:

image.png

如上图所示,公司在 2013 年发布大数据基础平台软件 TDH 2.0,2014 年发布数据 智能分析工具 Sophon 的早期版本 Discover 3.0,2017 年发布大数据开发工具 TDS 的早 期版本 Transwarp Studio 5.0 以及升级后的智能分析工具 Sophon 1.0,2018 年发布数据 云平台 TDC 1.0 以及分布式分析型数据库 ArgoDB 1.0,2019 年发布分布式交易型数据 库 KunDB 1.0 以及升级后的大数据开发工具 TDS。不断丰富的产品系列为客户提供数 据全生命周期的高效管理工具。

在技术演进方面,公司核心研发团队曾任职于英特尔,在英特尔基于 Apache Hadoop1.x 技术研发开源的 Hadoop 发行版产品,是行业中较早探索、研发大数据技术 的团队。在公司成立初期,公司基于当年新发布的 Apache Hadoop 2.0.4、Apache Spark 计算引擎等最新技术体系开发分布式大数据产品,相比原有 Apache Hadoop1.x,在技术 架构上存在较大差异,产品性能有较大幅度提升,起点走在了技术前沿。但是,随着企 业数据管理需求的快速释放,开源技术难以满足国内企业的业务需求,为适应传统硬件 特性而设计的开源技术架构局限性也随着硬件的快速进步而逐渐凸显。因此,为进一步 突破大数据技术的瓶颈以及完善企业级产品功能,公司通过自主研发的大数据技术逐步取代开源技术。以公司重要产品大数据基础平台 TDH 为例,多年来主要组件不断由开 源体系向自研体系转换,演进示意图及具体介绍如下:

image.png

image.png5、公司收入结构

报告期内,公司各业务收入构成情况如下:

image.png

二、发行人所处行业的基本情况

(一)发行人所属行业

公司专注于大数据与云基础平台、分布式关系型数据库、数据开发与智能分析工具 等大数据基础软件领域的自主研发,为企业客户和合作伙伴提供覆盖数据采集、存储、 治理、建模、分析、挖掘和流通等数据全生命周期的产品与服务。依据国家统计局《国 民经济行业分类》(GB/T4754-2017),公司所处行业属于软件和信息技术服务业(I65)。 依据证监会《上市公司行业分类指引》(2012 年修订),公司所处行业属于“信息传 输、软件和信息技术服务业(I)”中的“软件和信息技术服务业(I65)”。根据《战 略性新兴产业分类(2018)》,公司所属行业为“新一代信息技术产业”之“新兴软件 和新型信息技术服务”之“新兴软件开发”之“基础软件开发”。

三、竞争对手

(一)公司的市场地位

大数据基础软件是新兴科技领域,公司是国内较早专注于大数据基础软件研发的公 司,自主研发的大数据基础平台、分布式分析型数据库已达到业界先进水平。2018 年 3 月,公司大数据基础平台产品 TDH V5.1 正式通过国际知名组织 TPC 的基准测试 TPC-DS 的官方审计,成为全球首次完整通过该项基准测试的数据产品。2019 年 8 月, ArgoDB V1.2.1 版本正式通过了 TPC-DS 基准测试的官方审计,成为全球第四个通过的 数据库产品。

近年来,大数据等新兴技术的应用速度发展较快,截至本招股说明书签署日,公司 已累计有超过 1,000 家终端用户,分布在金融、政府、能源、交通、制造等众多国民经 济支柱领域,具备广泛的客户基础。其中,在金融领域公司已经取得一定市场份额,国 内多家银行、券商、基金等金融机构已采购公司产品及服务,且助力多个客户实现了分 析场景中部分关键系统的国产替代。在政府领域,公司产品已被多个部委或省市机关部 门使用,助力构建数字化政府,提升治理效率。

自成立以来,公司也获得众多第三方国际权威机构高度评价。2016 年 2 月,公司 被国际知名分析机构 Gartner 选入数据仓库及数据管理分析魔力象限,位于远见者象限,在前瞻性维度上优于 Cloudera、Hortonworks 等美国主流大数据平台厂商,是 Gartner 发布该魔力象限以来首个进入该魔力象限的中国公司。2017 年 2 月,公司再次入选 Gartner《2017 年分析型数据管理解决方案魔力象限》,成为当年入选该魔力象限的两 家中国企业之一。2017 年 10 月,IDC 发布《MarketScape:中国大数据管理平台市场》, 在中国大数据管理平台市场中,公司位列领导者象限。2018 年 4 月,知名分析机构 Wikibon 发布《2018 年大数据与分析供应商报告》,评价公司为“产品策略对西方供应 商非常具有指导意义的中国公司”。

在数据库领域,Oracle、IBM 等国外厂商凭借先发优势在数据库市场中占据了有利 地位。根据赛迪顾问发布的《2019-2020 年中国平台软件市场研究年度报告》,2019 年 我国的数据库管理系统市场仍以 Oracle、IBM、微软等国外品牌为主导。

image.png

随着数据量的快速积累以及非结构化数据类型增加,传统数据库难以解决大数据 “4V”问题。数据处理需求的变化推动了数据管理软件技术的变革,带动了以分布式 技术为主的大数据管理平台软件快速发展,并在大数据场景中正逐渐替代传统数据库。 根据 IDC 报告,2021 年上半年,公司在中国大数据平台软件的市场份额排名第七。各 厂商的市场占有率如下:

image.png

公司综合能力较强,2020 年 10 月,IDC 发布《MarketScape:中国大数据管理平台 厂商评估,2020》,公司综合能力排名市场第四,是中国大数据管理平台市场的领导者。 该综合能力指通过关键战略(包含增长、研发速度、生产效率等)、关键能力维度评价 (服务范围、客户服务交付等)对中国大数据管理平台厂商综合能力排名,如下:

image.png

2022 年 6 月,公司多个产品或子产品入选 Gartner 发布的《中国数据库管理系统供 应商识别指南》,在识别的 8 类数据库管理系统产品中,公司入选产品覆盖其中 7 类, 是覆盖超过 7 类或以上产品的四家厂商之一,以及覆盖多模数据库的四家厂商之一。

1、行业主要参与者

(1)国外公司

美国等发达国家信息产业发展较早,以 Oracle、IBM 和 Teradata 为代表的关系数据 库公司,其关系数据库在大数据环境下部署的扩展性、容错性、经济性、灵活性等方面 有一定局限性。因此在大数据领域,新兴的分布式架构大数据平台和/或分布式数据库 产品正在逐渐替代传统的关系数据库。以 Cloudera、MongoDB、Snowflake、Elastic 等 为代表的大数据平台和/或分布式数据库产品公司具备较强的技术积累,研发和推出了 相应的大数据基础软件及相关产品,获得了市场的认可,且部分公司通过在中国设立分 支机构或者通过经销商/合作伙伴,已经在中国市场获得了一定的市场占有率。

(2)国内公司

在国内,大数据市场主要参与者包括公有云厂商、ICT 厂商以及专业软件公司,其 中以华为云和阿里云代表的国内云厂商,基于自身在公有云环境下的优势,分别推出了 各自的大数据基础软件产品,公有云也是该类厂商提供大数据产品的主要方式;伴随近 年来大数据市场的快速发展,以新华三为代表的部分 ICT 厂商,也布局了相关大数据 软件产品;随着大数据技术的快速发展,以星环科技为代表的专业软件公司更加专注于 大数据领域,在大数据基础软件领域开展研发并推出了迎合中国市场需求的产品,获得 了相应的市场份额。

2、行业主要参与者情况

根据公开查询资料,公司与行业内主要可比公司的经营情况、技术实力、关键业务 数据对比如下:

Cloudera

Cloudera 是世界领先的开源数据管 理和分析解决方案提供商,成立于 2008 年,总部位于美国加州,拥有 雇员约 3,000 人。Cloudera 专注于 企业数据云领域,提供从边缘到人 工智能(from Edge to AI)的产品, 目前主要产品包括 Cloudera DataPlatform(CDP)、Cloudera DataFlow (CDF)等。

MongoDB

公司成立于 2007 年,主要提供事务 性数据库,分布式文件存储的数据 库。公司的核心产品是 MongoDB Enterprise Advanced、MongoDB Atlas 和 Community Server。

Snowflake

Snowflake 成立于 2012 年,目前主 要以云数据平台(Cloud Data Platform)为技术支撑,数据云(Data Cloud)为主要产品,解决数据孤岛 与数据治理问题,利用公有云的弹 性和性能,使客户以几乎为零的运 维成本,安全、合规的方式从快速 增长的数据集中获取价值。

Elastic

Elastic 成立于 2012 年,主要提供搜 索、站点搜索、企业搜索、日志记 录、指标、APM(应用程序性能管 理)、业务分析和安全分析等各种 用例,供开发人员直接使用。公司 开发和商业化了用于企业内部搜索 的 Elastic Stack,可以毫秒级的速 度,搜索、分析和图形可视化任何 来源、任何格式的数据,可被用于 应用搜索、网站搜索、商情分析、 信息安全数据分析、应用性能监测 (APM)等。

华为云

华为云成立于 2005 年,是华为的云 服务品牌,将华为在 ICT 领域的技 术积累和产品解决方案开放给客 户,致力于以在线方式将云计算、 大数据、人工智能产品与服务提供 给全球客户。华为公司于 2019 年发 布了全球首款人工智能原生 (AI-Native)数据库 GaussDB,支 持本地部署、私有云、公有云等多 种场景。华为云 FusionInsight 是华 为基于 Apache 开源社区软件进行 功能增强的企业级大数据存储、查 询和分析的统一平台,主要用于为 客户提供企业级数据湖解决方案。

阿里云

阿里云创立于 2008 年,产品包括弹性计算、存储、数据库、容器与中 间件、开发与运维、云计算、人工 智能等。阿里云的数据库产品涵盖 关系型数据库、非关系型数据库、 数据仓库、数据库生态工具四大版 块,可以为企业数据生产和集成、 实时处理、分析与发现、开发与管 理提供全链路生命周期的服务。其 中,阿里云 MaxCompute 是面向分 析的企业 SaaS 模式云数据仓库,阿 里云 E-MapReduce(EMR),是运 行在阿里云平台上,基于开源的 Apache Hadoop 和 Apache Spark 的 一种大数据处理的系统解决方案

新华三

新华三拥有计算、存储、网络、安 全等数字化基础设施整体能力, 2017 年推出完整的大数据产品线, 成立新华三大数据技术有限公司, 随后一直将大数据作为集团重点战 略。2020 年,新华三成立云与智能 产品线,专门负责云、大数据和 AI 领域。

四、发行人报告期的主要财务数据及财务指标

                                   2022年1季度                                                        2021

营业总收入(元)               9758.31万                                                        3.31亿         

净利润(元)                        -1.65亿                                                            -2.45亿

扣非净利润(元)                 -1.83亿                                                             -2.82亿

发行股数 不超过3,021.0600 万股

发行后总股本 不超过12,084.2068 万股

行业市盈率:44.32倍(2022.9.25数据)

同行业可比公司静态市销率估值(不扣非):5.76(奇安信)、30.41(金山办公)、6.43(安恒信息)、24.85(中望软件)去除极值16.86

同行业可比公司动态市销率估值(不扣非):8.50(奇安信)、27.83(金山办公)、11.00(安恒信息)、39.64(中望软件)去除极值21.74

公司EPS静态不扣非:-

公司EPS静态扣非:-

公司EPS动态不扣非:-

公司EPS动态扣非:-

主营业务收入动态:1.95亿

主营业务收入静态:3.31亿

拟募集资金196,053.38万元,募集资金需要发行价64.90元,实际募集资金:14.30亿元.

募集资金用途:1大数据与云基础平台建设项目2分布式关系型数据库建设项目3数据开发与智能分析工具软件研发项目

行业市盈率预估发行价:-元,可比公司预估市销率发行价静态:55.81元,可比公司预估市销率发行价动态:71.96元.

9月发行新股数量37只.

请上游主要为

中游产业包括 

注下游主要为



计算机 -- 软件开发 -- 垂直应用软件

所属地域:广东省

主营业务:从事CAD/CAM/CAE等研发设计类工业软件的研发、推广与销售业务。    

产品名称:ZWCAD  、中CAD机械版  、中望CAD建筑版  、中望建筑水暖电  、中望结构  、中望景园  、中望龙腾冲压  、龙腾塑胶模具  、ZW3D  、3D One  、中望3D教育版  、ZWSim-EM    

控股股东:杜玉林、李红 (持有广州中望龙腾软件股份有限公司股份比例:36.59、6.40%)

实际控制人:杜玉林、李红 (持有广州中望龙腾软件股份有限公司股份比例:36.59、6.40%)

   

 明出处关键词:大数据基础软件、数据库产品

(1)大数据基础软件业务1)基础软件产品① 大数据与云基础平台软件 Ⅰ、大数据基础平台(TDH)Ⅱ、数据云平台(TDC)②分布式关系型数据库软件Ⅰ、分布式分析型数据库(ArgoDB)Ⅱ、分布式交易型数据库(KunDB)

Ⅲ、分析型数据库及交易型数据库联合应用

③数据开发与智能分析工具软件Ⅰ、大数据开发工具(TDS)Ⅱ、智能分析工具(Sophon)2)技术服务(2)应用与解决方案1)数据应用解决方案2)业务应用解决方案(3)其他业务

1、大数据行业发展背景(1)大数据时代下传统数据管理软件面临多种挑战(2)传统集中式软件栈向新兴分布式软件栈演进(3)国产基础软件迎来爆发式增长阶段

2、大数据市场构成

3、大数据全生命周期管理阶段(1)大数据集成(2)大数据存储和处理(3)数据治理简介(4)数据建模(5)数据分析和挖掘(6)数据流通

4、大数据行业市场规模(1)全球大数据市场发展情况(2)国内大数据市场发展情况

(四)大数据行业未来发展趋势1、分布式系统成为行业技术架构主要的发展方向2、数据管理软件趋向于统一多数据模型的平台3、云原生大数据平台架构成为未来的主要发展方向4、国家加速数据要素市场建设,推动数据安全流通技术的商业化加速

发行公告可比公司:星环科技、奇安信、金山办公、安恒信息、中望软件

大数据基础软件竞争对手:星环科技、华为云、阿里云、新华三

上市首日股价20%元,44%元,流通市值:(注册制)

实际发行价: 47.34​元,发行流通市值14.30亿,发行总市值57.11亿.

价格区间42.39元,最高77.30元,最低16.58元。是否有炒作价值:无

上市首日市销率:29.34倍。行业市盈率是否高估:  可比公司市销率是否高估: 是

上市首日开盘价,溢价率%,流通市值,开盘价估值

是否建议申购: 按市销率估不低。但是静态市销率不高。。鉴于,次新可能出拐点,即使破发,也有希望。。可以考虑。

你是否有战略配售:本次发行最终战略配售数量为 208.4398 万股,占发行总数量的 6.90%

股是否有保荐公司跟投:本次获配股数 120.8424 万股

预计三季报业绩:净利润-2.476亿元至-2.034亿元,变动幅度为-17.70%至3.30%   预计全年EPS-   三季报pe-

如果对您有所帮助,感谢点赞+关注,欢迎转发分享给更多有需要的朋友!

风险揭示:股市有风险,投资需谨慎。请您务必对此有清醒的认识,认真考虑是否进行证券交易。投资建议内容仅供参考,不构成直接买卖建议,投资者须对其投资行为进行独立判断。

作者利益披露:原创,不作为证券推荐或投资建议,截至发文时,作者不持有相关标的。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
平安银行
工分
5.67
转发
收藏
投诉
复制链接
分享到微信
有用 6
打赏作者
无用
真知无价,用钱说话
1个人打赏
同时转发
评论(4)
只看楼主
热度排序
最新发布
最新互动
  • 只看TA
    2022-10-02 18:57
    感谢分享
    0
    0
    打赏
    回复
    投诉
  • 那我走乀
    春风吹又生的小韭菜
    只看TA
    2022-09-29 13:06
    可以看看
    0
    0
    打赏
    回复
    投诉
  • 只看TA
    2022-09-29 12:02
    1
    0
    0
    打赏
    回复
    投诉
  • 只看TA
    2022-09-29 11:54
    谢谢
    0
    0
    打赏
    回复
    投诉
  • 1
前往