国产大数据基础软件第一股即将上市为了不再被“卡脖子”

 

  星环信息科技(上海)股份有限公司(以下简称“星环科技”)即将在科创板上市,近日将启动网上打新。招股书显示,星环科技本次IPO计划募集资金19.6亿元,其中8.98亿元用于大数据与云基础平台建设项目,7.09亿元用于分布式关系型数据库建设项目,3.53亿元用于数据开发与智能分析工具软件研发项目。

  上市之后星环科技将成为“国产大数据基础软件第一股”。近年来,美国对中国核心科技持续封锁和打压,人们越来越深切地认识到,必须要坚持自主创新,将核心关键技术掌握在自己手中,避免关键技术被“卡脖子”。有“国产大数据基础软件第一股”之称的星环科技的上市无疑将加速我国大数据基础软件的自主研发和国产替代进程,推动国家自主可控战略的落实,帮助早日解决关键技术的“卡脖子”难题。

  2013年,时任英特尔数据中心软件部亚太区CTO的孙元浩离开了服务多年的英特尔创办了星环科技。“星环”两个字源于《三体》——这是孙元浩非常喜欢看的一部科幻小说。《三体》中的星环集团聚集了人类最优秀的一批科学家,在太阳系遭受“维度攻击”时,建造成太阳系的第一艘超光速飞船——星环号。星环科技公司之名就是由此而来,孙元浩对公司未来发展的期望由此可见一斑。

  星环科技成立的2013年正是大数据技术最火的年份,利用大数据技术成为当年众多中国企业的选择。当时,主流的大数据技术都来自国外,面对中国市场更海量的数据和更为复杂的应用场景时,常常是力不从心。孙元浩认为,中国需要有自己的大数据平台,星环科技就将承载这一使命。他将星环科技定位为一家大数据基础平台产品供应商,致力于帮助客户盘活数据,充分释放数据价值,加速其数字化、智能化转型进程。

  星环科技的核心研发团队曾任职于英特尔,主导了英特尔Hadoop发行版的研发,是行业中较早探索、研发大数据技术的团队,其早期产品和解决方案都是基于开源Hadoop产品构建的。随着大数据项目的不断落地,星环科技越来越认识到开源产品的不足。为了突破大数据技术的瓶颈,星环科技决定用自主研发的大数据技术逐步取代开源技术。随后,星环科技一年一个台阶开始了产品的快速迭代:

  2014年公司正式发布了关系型分析引擎 Inceptor,替代了Hive和Spark计算引擎

  2020年公司发布 TDH 7.0,引入了统一的SQL引擎和统一的计算引擎,和基于新技术架构开发的搜索引擎 New Search(2021 年升级改名为 Scope)

  通过多年的努力,目前星环科技已经基本完成了各种产品和解决方案中开源组件的替换,形成了大数据与云基础平台、分布式关系型数据库、数据开发与智能分析工具的软件产品矩阵。根据工信部电子第五研究所代码扫描测试报告,大数据平台TDH 的1200万行代码中自研代码率超过70%,分布式数据库ArgoDB代码自主率(行数)超过90%。

  通过这些产品星环科技可以帮助解决采用传统集中式软件架构的信息系统所面临的大数据处理难题,为企业提供处理海量规模、快速流转和多样化类型数据的大数据处理技术,帮助用户发掘数据价值。

  不难想象,星环科技选择抛弃开源软件,全面走向自主研发,一路走来会面临着不少挑战和困难,但脱离了开源软件,没有了原来架构的掣肘,星环科技也能更容易在技术上突破。

  事实也正是如此。多年下来,星环科技重构了大数据与分布式数据库软件栈,先后积累了31项核心技术,其中包括12项基础核心技术,主要体现在分布式技术、SQL 编译技术、数据库技术、多模型数据的统一处理技术、基于容器的数据云技术以及大数据开发与智能分析技术等方面。截至2022年6月30日,公司已获授权境内专利77 项(其中发明专利74 项)及境外专利8 项,以及累计授权328 项软件著作权。

  具体而言,在分布式技术方面,星环科技设计了全新的大数据技术栈,实现了统一的分布式计算技术、分布式一致性技术、分布式存储管理技术和分布式事务技术,使用统一融合的数据平台架构取代了业界的混合架构。其大数据基础平台TDH是全球首个通过TPC-DS基准测试并经官方审计的产品,体现了星环科技基于分布式架构构建的基础软件在海量数据的计算和分析上达到业界先进水平。还有分布式事务,星环科技从2015 年开始支持分布式事务技术,提供了强一致性和完整性的保障,让开发者能够开发适合金融、能源等关键任务场景的大数据应用系统。当时业界普遍认为大规模分布式系统只能实现最终一致性的认知,直到2018年才普遍实现了强一致性。

  在多模型融合技术方面,星环科技也扮演了引领者的角色。面对种类繁多的数据类型,不同厂商采用了不同的技术策略:用统一的计算引擎和存储引擎来处理所有数据;或者用各种不同的计算引擎和存储引擎来分别处理不同类型的数据。而星环科技是采用多模融合技术,以一站式平台支持多达10种数据模型。基于这种技术的TDH实现了统一的SQL引擎、统一的分布式计算引擎和统一的分布式数据管理系统和统一的资源管理系统,以及多种异构的数据模型,用户可以通过统一入口对关系型、文本、图数据等数据模型进行操作,从而具备了多模型数据能力。

  星环科技还是云原生技术的积极倡导者和引领者,其研发出基于容器的资源调度产品Transwarp Cloud Operating System(简称“TCOS”)和数据云平台Transwarp Data Cloud(简称“TDC”),在业界较早提供了基于容器的统一资源管理技术、多租户隔离技术和统一的工作负载管理技术。

  星环科技的技术突破得到众多第三方和用户的认可。2016年2月,入选Gartner《数据仓库及数据管理分析魔力象限》,位于远见者象限,是首个进入该魔力象限的中国公司。2017 年2 月,公司入选Gartner《2017 年分析型数据管理解决方案魔力象限》,成为当年入选该魔力象限的两家中国企业之一。2020年10月,IDC发布的《MarketScape:中国大数据管理平台厂商评估,2020》,星环科技综合能力排名市场第四。在客户方面,累计超过1000 家,分布在金融、政府、能源、交通、制造等众多国民经济支柱领域,其中不乏中国银行、中国石油、南方电网、中国邮政集团、郑州地铁这样的头部客户。

  这份成绩的背后是星环科技长期持续的投入。为了实现在技术上的突破,星环科技在技术研发及技术产业化方面投入了大量的资源和成本。招股书显示,报告期内星环科技的研发费用分别为1.09亿元、1.094亿元及1.4亿元,研发费用占营业收入的比例分别为62.66%、42.11%和42.46%,研发费用规模占比远超一般企业。

  由于数据量的爆炸性增长和人们对数据价值的高度认可,这些年我国大数据软件市场规模一直保持高速增长态势。根据沙利文研究提供的数据,中国大数据软件市场将在未来五年保持高速增长,整体软件市场规模将在2024年达到492 亿元,2019年至2024年复合增长率为 27.5%。

  市场高增长的背后是国家对大数据产业给予高度重视。“十四五”规划和2035年远景目标纲要提出,培育壮大人工智能、大数据等新兴数字产业,充分发挥海量数据和丰富应用场景优势,促进数字技术与实体经济深度融合,赋能传统行业转型升级。《“十四五”大数据产业发展规划》也提出,到2025年大数据产业测算规模突破3万亿元,年均复合增长率保持在25%左右。

  今天全球新一代信息产业正处于加速变革期,大数据相关底层技术处于创新突破期,国内市场需求处于爆发期,随着自主研发的国产大数据生态体系正在形成,国产大数据产品与服务迎来较好的发展机遇。所有这些对于具有自主知识产权和掌握了核心关键技术的星环科技而言无疑都是利好。

  当下星环科技还处于投入期,招股说明书显示,2020年到2022年上半年,星环科技实现营业收入2.6亿元、3.31亿元和9758.31万元;实现净利润分别为-1.84亿元、-2.45亿元和-1.65亿元,持续亏损。随着星环科技成功上市,相信星环科技将会拥有更为充足的资源来丰富和完善产品、开拓市场,大幅提升其盈利能力,从而实现自身的造血。

  星环科技在招股书中也提出,面向未来,公司将继续专注大数据及相关基础软件的研发,通过技术研发、打造行业生态并提升市场占有率,成为大数据基础软件行业的引领者,助力中国社会的数字化转型。

  前路注定不会一路平坦,但有了过去这些年的积累,加上资本的加持,我们相信星环科技能开辟出一条属于中国基础软件厂商自己的道路,助力众多行业领域完成对开源和国外产品的替代。同时,我们也希望能涌现出更多的中国科技企业与星环科技同行!

  免责声明:此文内容为本网站转载企业资讯,仅代表作者个人观点,与本网无关。所涉内容不构成投资、消费建议,仅供读者参考,并请自行核实相关内容。

  星环信息科技(上海)股份有限公司(以下简称“星环科技”)即将在科创板上市,近日将启动网上打新。招股书显示,星环科技本次IPO计划募集资金19.6亿元,其中8.98亿元用于大数据与云基础平台建设项目,7.09亿元用于分布式关系型数据库建设项目,3.53亿元用于数据开发与智能分析工具软件研发项目。

搜索