全球生成式人工智能(GenAI)成果公布情况分析报告

 

  生成式人工智能(Generative AI)是人工智能领域的一个前沿分支,以数据驱动的方式,利用大模型在大数据集上进行大规模学习,通过识别数据中的模式和关系以创造新内容的人工智能技术,为一系列工业和应用提供动力。由于其独特的创造能力,引起了学术界和工业界的广泛关注。随着生成式AI技术的快速发展,涉及的专利和论文数量也呈爆发趋势。本文基于专利和论文公开现状,就全球范围内生成式AI技术的最新进展进行分析。

  注:本研究报告图表主要参考世界知识产权组织(WIPO)发布的《生成式人工智能(GenAI)专利态势报告》和美国乔治城大学数据分析平台ETO。

  2024年7月3日,世界知识产权组织(WIPO)发布《生成式人工智能(GenAI)专利态势报告》。旨在通过分析GenAI专利的趋势和数据,让人们更好地理解这项快速进步技术的来龙去脉,帮助政策制定者规划其发展,以符合人类的共同利益。

  如图1所示,2014年至2023年,中国发明人申请的生成式人工智能专利数量最多,远超美国、韩国、日本和印度等国。2014年至2023年,全球生成式人工智能相关的发明申请量达54000件,其中超过25%是在2023年出现的。过去十年间,中国提交了超3.8万份生成式AI专利申请,是同期美国提交申请数量(6276份)的约六倍。韩国、日本和印度则分别排名第三,第四和第五。

  如图2所示,中国企业和机构前十占六、前五占四,美国前十占三。腾讯、平安保险集团和百度拥有最多的GenAI 专利。腾讯计划在微信等产品中加入 GenAI 功能,以改善用户体验。中国平安专注于用于承保和风险评估的 GenAI 模型。百度是 GenAI 领域的早期参与者之一,最近发布了最新的基于 LLM的人工智能聊天机器人ERNIE 4.0。中国科学院(排名第4)是排名前十的唯一研究机构。阿里巴巴(排名第6)和字节跳动(排名第9)是进入前十名的中国公司。

  IBM(排名第5)、Alphabet/谷歌(排名第8)和微软(排名第10)是拥有 GenAI 专利最多的美国公司。IBM 开发了GenAI平台--watsonx,使公司能够部署和定制 LLM,重点关注数据安全性和合规性。Alphabet/Google的人工智能部门DeepMind最近发布了最新的LLM模型Gemini,该模型正逐步集成到Alphabet/Google 的产品和服务中。微软是GenAI的另一个重要参与者,也是 OpenAI的投资者。OpenAI本身最近才申请了第一批GenAI专利。另外排在前十位的是来自韩国的三星电子(排名第7)。

  根据专利上公布的发明人地址,2014年至2023年间,总部设在中国的发明人产生了38000多个专利族。自2017年以来,中国每年在该领域公布的专利数量超过了其他所有国家的总和。美国拥有约6300项专利家族,是GenAI专利申请的第二大重要研究地点。韩国、日本和印度是GenAI 的其他重要研究地点,均位居全球前五位。英国是欧洲的领头羊,同期公布了714项专利。德国紧随其后公布了708项专利,近年来公布的 GenAI 专利数量超过了英国。以上7个国家贡献的专利族数量在全球占比94%。

  在应用方面,中国是所有GenAI 应用的主要发明地。在软件/其他应用、文件管理和出版、银行和金融、能源管理、制图和工业产权、法律、社会和行为科学等领域,中国的相对领先优势尤为明显;美国位居第二,在物理科学与工程、生命科学与医学、军事、农业、娱乐和教育领域的所有 GenAI 专利家族中占有很高的份额;韩国在商业解决方案、教育和农业领域的 GenAI 专利家族数量相对较多;日本在娱乐、艺术和人文领域的研究实力较强;印度在网络和智能城市领域的GenAI专利家族数量高于平均水平;英国在物理科学和工程学领域表现突出;德国在物理科学和工程学以及工业和制造业方面具有良好的科研实力。

  WIPO发布的报告强调,生成式AI技术可能带来的劳动力市场挑战。与以往主要影响中等技能工人的自动化浪潮不同,AI技术的广泛应用可能会取代部分高薪职位,如数据分析师、市场研究分析师或律师助理等,这要求各国政府和企业必须关注AI技术的发展趋势,加强相关领域的培训和教育,以应对可能带来的劳动力市场变革。

  生成式AI技术的发展也带来了一系列的新问题,例如在版权和知识产权保护方面的挑战,AI生成的文本、图像和音频涉及侵犯版权,目前中美都已经出现了相应的判例,判决结果并不统一,主要聚焦在AI生成过程中人类的贡献程度。另一个备受争议的问题是人工智能发明是否可以申请专利,在2024年6月11日之前,全世界所有主要国家,包括美国、英国、德国、中国、日本、澳大利亚、新西兰等司法管辖区的专利局和法院,都一致认为只有自然人,才是专利法意义上合格的发明人,人工智能不能获得发明人的资格,从而获得专利权。然而在德国联邦法院(BHG)在2024年6月11日作出的判决中表明AI可以作为发明人获得专利权。后续审查标准是否会产生巨大变革也引起广泛的争论。

  根据乔治城大学的数据分析平台ETO在今年5月发布的最新调查报告显示:2017—2022年期间,全球一共发布了125.5万篇与AI相关的论文。其中,中国发布了24.3万篇AI论文,占到了总数的25%,成为发布论文最多的国家,乔治城大学只统计了英文技术论文,如果算上中文论文,那么中国发布的论文数量将会更多。美国发布了17.1万篇论文,占总数的18%,排名第二;剩下的论文由欧洲、亚太地区国家贡献。

  在AI论文研究领域方面,中国在计算机视觉模型、机器人技术成为发布、研究最多的领域,总计14万篇左右;在自然语言处理为1.9万篇左右、AI安全方面为2557篇。尽管AI安全研究在整体AI研究中的占比仅为2%,但其增长速度惊人,在五年内增长了315%,显示出该领域的重要性日益增加。

  报告显示,在文章被引次数排行榜上,中国科学院位居榜首,在2017至2022年间发表的人工智能相关论文,被引次数为14995次,清华大学位居第二,文章被引次数为10129次,其次是法国的国家科学研究中心、中国科学院大学和上海交通大学。

  报告还强调了企业在人工智能研究中的重要角色。数据显示,6%的人工智能研究文章由企业作者撰写,这一比例明显高于一般学术文章的3%。表示企业在推动人工智能技术应用与发展的过程中发挥了关键作用。

  其中,谷歌排名第一,发布了6529篇论文,平均每篇被引用次数达到183.8;微软排名第二发布了5558篇,平均引用次数为82.8;腾讯排名第三,发布了2760篇,平均引用次数为54.2;阿里巴巴排名第四,发布了2518篇,平均被引用次数为42.3;Meta排名第五,发布了2280篇,平均引用次数为181;亚马逊排名第六,发布了2026篇,平均引用次数为43.5;IBM排名第七,发布了1574,平均引用次数为52.5;三星排名第八,发布了1530篇,平均引用次数为29.3;华为排名第九,发布了1485,平均引用次数为36;百度排名第十,发布了1355篇,平均引用次数为61。

  在2017—2022年期间,大约有40万篇论文是关于AI视觉模型的,整体增长了121%,成为AI增长最快的子领域。典型代表模型有Midjourney、Stable Diffusion、DALL·E 3、Sora、Gen-3等;大约有13.5万篇论文是关于自然语言处理的,整体增长了104%。典型的模型有ChatGPT、书生浦语InternLM、文心一言、Kimi、通义千问等。

  OpenAI作为AI领域的先锋代表,在全球范围内备受瞩目,但并未出现在专利和论文发布的排行榜上。据分析,这可能与OpenAI的组织性质和发展策略有关。OpenAI起源于非营利组织,并逐渐过渡到“有上限”的盈利模式,这可能影响了其专利申请的决策。另一方面,OpenAI也可能选择以商业机密的形式来保护其知识产权,以避免技术泄露和竞争压力。

  基于全球蓬勃发展的AI专利及论文情况,笔者特意针对大模型底层技术Transformer情况进行了检索分析。谷歌公司于2017年5月23日针对Transformer架构这一技术创新在美国正式递交了专利申请,并随后在中欧、日韩等多个国家进行了专利布局,累计专利申请数量达到50件(围绕一件母专利布局)。目前谷歌公司的Transformer架构专利已于2022年在中国境内进入审查阶段,目前正处于专利复审流程,Transformer架构专利能否在中国授权对国内科研机构及企业将产生的影响值得关注。

  根据专利及论文数量分析,2017年之后,全球AI研究增长了一倍多,这在很大程度上得益于自然语言处理和计算机视觉技术研究的快速增长。分析中还发现,AI安全研究进展很快,但基础比较薄弱,目前仅占整个AI研究的2%。

  中国在AI论文及专利数量方面处于领先地位;但如果仅计算高频率被引用论文数量,美国排名第一。查阅arxiv、SSRN、《自然》、IEEE等顶级论文平台,以及HuggingFace、GitHub等开源项目就能发现,国内机构出现频率相当高,而且多数项目创新性都不错,评价也很高。即便是国外科技巨头谷歌、微软、OpenAI、Meta、苹果等的AI论文、项目,华人的贡献也占据了重要地位。从数据中可以看出,中国对于生成式AI、大模型的重视程度、所拥有的技术环境以及庞大的AI人才库。

  徐震寰,上海人工智能实验室知识产权专员;鹿艺,上海人工智能实验室高级工程师,国际注册技术许可专家。文章观点不代表主办机构立场。

  特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

  多国与微软“蓝屏”斗争、中国躲过一劫,新加坡专家:这证明了中国对外国技术的战略

  抵销借款3.5亿元,华谊兄弟拟将东阳美拉70%股权转让给阿里影业!曾用该公司与冯小刚对赌

  默认启用开源内核模块,英伟达 Linux 显卡驱动 560.28.03 版发布

  【精选】只用pytorch 如何从零训练自己的大模型?AI大模型源码解读 分词器设计 大模型训练流程...

  【奇葩地理】有一头熊掉到一个陷阱里,请问熊是什么颜色?地理视角分析葫芦娃是哪里人

搜索