连载之(1)美国斯坦福大学:2023 年 人工智能指数报告
转载 2023-04-20 12:04 南山 来源:中叉网 欢迎阅读第六版人工智能指数报告! 今年,报告引入了比以往任何一版都多的原始数据,包括新的人工智能舆论章节、更透彻的技术性能章节、大语言和多模态模型的原始分析、全球人工智能立法记录的详细趋势。
人工智能系统对环境影响的研究等等。人工智能指数报告跟踪、整理、提炼和可视化与人工智能相关的数据。我们的使命是提供公正、经过严格审查、来源广泛的数据,以便决策者、研究人员、高管、记者和公众对复杂的 AI 领域有更透彻和细致的了解。该报告旨在成为全球最可靠、最权威的人工智能数据和见解来源。
来自公司的决策者
人工智能已经进入部署时代; 在整个 2022 年和 2023 年初,每个月都会发布新的大型 AI 模型。这些模型,例如 ChatGPT、Stable Diffusion、Whisper 和 DALL-E 2,能够执行越来越广泛的任务,从文本处理和分析到图像生成,再到前所未有的良好语音识别。这些系统展示了十年前无法想象的问答和文本、图像和代码生成能力,并且它们在许多新旧基准测试中的表现优于最先进的技术水平。然而,他们容易产生幻觉,经常有偏见,并且可能被诱骗服务于邪恶的目的,突出了与其部署相关的复杂道德挑战。
尽管 2022 年是私人 AI 投资十年来下降的第一年,但 AI 仍然是政策制定者、行业领导者、研究人员和公众非常感兴趣的话题。政策制定者比以往任何时候都更多地谈论人工智能。将 AI 集成到其业务中的行业领导者正在看到切实的成本和收入收益。AI 出版物和合作的数量持续增加。公众对 AI 以及他们喜欢或不喜欢的元素形成了更敏锐的看法。人工智能将继续改进,并因此成为我们生活中更重要的一部分。
鉴于这项技术的日益普及及其造成大规模破坏的潜力,我们都应该开始更加批判性地思考我们究竟希望如何开发和部署 AI。我们还应该询问谁在部署它——正如我们的分析所示,人工智能越来越多地由一小部分私营部门参与者的行为来定义,而不是更广泛的社会参与者。今年的 AI 指数描绘了迄今为止我们在 AI 方面的进展情况,以突出未来可能等待我们的东西。
10大要点
(1)工业界的竞争领先于学术界。直到2014年,最重要的机器学习模型都是由学术界发布的。从那时起,工业就接管了公司。在2022年,有32种重要的行业生产的机器学习模型,而学术界生产的只有3种。构建最先进的人工智能系统越来越需要大量的数据、计算机能力和金钱——与非营利组织和学术界相比,行业参与者天生拥有更多的资源。
(2)在传统基准测试上的性能饱和度。人工智能继续发布最先进的结果,但在许多基准测试上的同比改善仍然很少。此外,达到基准饱和度的速度也在增加。然而,新的、更全面的基准测试套件,如BIG-bench和HELM正在发布。
(3)人工智能既在帮助环境,也在损害环境。新研究表明,人工智能系统会对环境产生严重影响。根据 Luccioni 等人的数据,到 2022 年,BLOOM 的训练所产生的碳排放比一名从纽约到旧金山的单程航空旅客排放的碳多 25 倍。尽管如此,像 BCOOLER 这样的新强化学习模型表明,人工智能系统可用于优化能源使用。
(4)世界上最好的新科学家……人工智能吗?人工智能模型开始迅速加速科学进步,并于2022年被用于帮助氢气融合,提高基质操作的效率,并产生新的抗体。
(5)有关滥用人工智能的事件的数量正在迅速增加。根据追踪人工智能道德滥用相关事件的AIAAIC数据库,自2012年以来,人工智能事件和争议的数量增加了26倍。2022年发生的一些值得注意的事件包括一段乌克兰总统泽伦斯基投降的深度伪造视频,以及美国监狱对囚犯使用电话监控技术。这一增长证明了人工智能技术的使用量增加,也意识到了滥用的可能性。
(6)几乎所有美国工业部门对与人工智能相关的专业技能的需求都在增加。在美国所有有数据的部门(农业、林业、渔业和狩猎除外),与ai相关的职位发布数量平均从2021年的1.7%增加到2022年的1.9%。美国的雇主正在越来越多地寻找具有艾滋病相关技能的工人。
(7)过去十年来,私人对人工智能的投资首次同比下降。2022年,全球人工智能私人投资为919亿美元,较2021年下降了26.7%。与人工智能相关的融资事件总数以及新融资的人工智能公司数量也同样减少。尽管如此,在过去十年中,人工智能投资大幅增加。2022年,私人对人工智能的投资数量是2013年的18倍。
(8)虽然采用人工智能的公司比例已经趋于稳定,但采用人工智能的公司仍在继续领先。麦肯锡的年度研究调查结果显示,自2027年以来,采用人工智能的公司在2022年的比例增加了一倍多,尽管近年来已稳定在50%至60%之间。采用人工智能的组织报告称,它们实现了有意义的成本下降和收入增加。
(9)决策者对人工智能的兴趣正在上升。一项对127个国家立法记录的人工智能指数分析显示,通过成为法律的包含“人工智能”的法案数量从2016年的仅1项增加到2022年的37项。对81个国家关于人工智能的议会记录的分析同样显示,自2016年以来,全球立法程序中提到人工智能的次数增加了近6.5倍。
(10)中国公民是那些对人工智能产品和服务感觉最积极的人之一。美国人……并没有那么多。在2022年IPSOS的一项调查中,78%的中国受访者(受访国家的比例最高)同意这一说法,即使用人工智能的产品和服务利大于弊的说法。在中国的受访者之后,来自沙特阿拉伯(76%)和印度(71%)的受访者对人工智能产品感到最为积极。只有35%的抽样美国人(受调查比例最低的国家)认为,使用人工智能的产品和服务利大于弊。
如何引用本报告
Nestor Maslej、Loredana Fattorini、Erik Brynjolfsson、John Etchemendy、Katrina Ligett、Terah Lyons、James Manyika、Helen Ngo、Juan Carlos Niebles、Vanessa Parli、Yoav Shoham、Russell Wald、Jack Clark 和 Raymond Perrault,“2023 年人工智能指数 报告”,AI Index 指导委员会,斯坦福大学以人为本的 AI 研究所,加利福尼亚州斯坦福,2023 年 4 月。
斯坦福大学的 AI Index 2023 年度报告已获得 Attribution-NoDerivatives 4.0 International 许可。
报告亮点
第一章:研究与发展
从2010年到2021年,美国和中国在人工智能出版物方面的跨界合作数量最多,尽管合作的速度已经放缓。自2010年以来,美国和中国之间的人工智能研究合作数量增加了大约4倍,比仅次于最近的国家对英国和中国的合作总数高出2.5倍。然而,从2020年到2021年,U.S.-China合作的总数仅增长了2.1%,这是自2010年以来的最低同比增长率。
对人工智能的研究正在全面兴起;自2010年以来,人工智能出版物的总数已经增加了一倍多。继续主导研究的特定人工智能主题包括模式识别、机器学习和计算机视觉。
中国在人工智能期刊、会议和知识库出版物总量方面继续领先;美国在人工智能会议和存储库引用方面仍领先,但这些领先优势正在慢慢侵蚀。尽管如此,世界上大多数的大型语言和多模态模式(2022年为54%)都是由美国机构生产的。
工业界的竞争领先于学术界;直到2014年,最重要的机器学习模型都是由学术界发布的。从那时起,工业就接管了公司。在2022年,有32种重要的行业生产的机器学习模型,而学术界生产的只有3种。构建最先进的人工智能系统越来越需要大量的数据、计算机能力和金钱——与非营利组织和学术界相比,行业参与者天生拥有更多的资源。
大型语言模型的规模越来越大,成本也越来越高;GPT-2发布于2019年,被许多人认为是第一个大型语言模型,有15亿个参数,培训成本估计为5万美元。PaLM是2022年推出的旗舰大型语言模型之一,拥有5400亿个参数,估计花费了800万美元——PaLM大约是GPT-2的360倍,成本是160倍。这不仅仅是PaLM:总之,大型语言和多模式模型正变得越来越大、越来越昂贵。
第二章:技术性能
在传统的基准测试上的性能饱和;人工智能继续发布最先进的结果,但在许多基准测试上的同比改善仍然很少。此外,达到基准饱和度的速度也在增加。然而,新的、更全面的基准测试套件,如BIG-bench和HELM正在发布。
生成性人工智能进入了公众的视野;2022年,像DALL-E 2和稳定扩散这样的文本到图像模型发布了,像make-a-视频这样的文本到视频系统,以及像ChatGPT这样的聊天机器人。尽管如此,这些系统还是容易产生幻觉,自信地输出不连贯或不真实的反应,这使得很难在关键的应用中依赖它们。
人工智能系统变得更加灵活;传统上,人工智能系统在狭窄的任务上表现良好,但在更广泛的任务中却很困难。最近发布的模型挑战了这一趋势;BEiT-3、PaLI和Gato等地,单一的人工智能系统越来越能够导航多个任务(例如,视觉、语言)。
有能力的语言模型仍然难以进行推理;语言模型继续提高它们的生成能力,但新的研究表明,它们仍然难以完成复杂的规划任务。
人工智能既帮助又破坏了环境;新的研究表明,人工智能系统可能会产生严重的环境影响。根据Luccioni等人,2022年,布鲁姆的训练运行排放的碳比从纽约到旧金山的单程旅行者多25倍。尽管如此,像空气冷却器这样的新的强化学习模型表明,人工智能系统可以用于优化能源使用。
世界上最好的新科学家……人工智能吗?人工智能模型开始迅速加速科学进步,并于2022年被用于帮助氢聚变,提高矩阵操作效率并生成新抗体。
人工智能开始构建更好的人工智能;英伟达使用了一种人工智能强化学习代理来改进为人工智能系统提供动力的芯片的设计。类似地,谷歌最近使用它的一种语言模型PaLM提出了改进相同模型的方法。自我改进的人工智能学习将加速人工智能的进步。
第三章:模型尺度
对偏差和毒性的影响被训练数据和缓解方法混淆了;在过去的一年里,一些机构建立了自己的基于专有数据训练的大型模型——虽然大型模型仍然是有毒的和有偏见的,但新的证据表明,通过指令调优训练大型模型后,这些问题可以在一定程度上得到缓解。
生成模型已经出现,它们的伦理问题也出现了;2022年,生成模型成为时代精神的一部分。这些模式很有能力,但也带有伦理上的挑战。文本图像生成器通常对性别维度有偏见,而像ChatGPT这样的聊天机器人可以被骗去为邪恶的目标服务。
有关滥用人工智能的事件数量正在迅速增加;根据追踪人工智能道德滥用相关事件的AIAAIC数据库,自2012年以来,人工智能事件和争议的数量增加了26倍。2022年发生的一些值得注意的事件包括一段乌克兰总统泽伦斯基投降的深度伪造视频,以及美国监狱对囚犯使用电话监控技术。这一增长证明了人工智能技术的使用量增加,也意识到了滥用的可能性。
更公平的模型可能不会更有偏见;对语言模型的广泛分析表明,虽然表现和公平之间存在明显的相关性,但公平和偏见可能是不一致的:在某些公平基准上表现更好的语言模型往往有更差的性别偏见。
人们对人工智能伦理学的兴趣继续飙升;领先的人工智能伦理会议FAccT被接受的提交数量自2021年以来增加了一倍多,自2018年以来增加了10倍。2022年,行业参与者的提交数量也比以往任何时候都多。
使用自然语言处理的自动事实核查毕竟并不是那么简单;虽然已经开发了几个自动事实核查的基准,但研究人员发现,16个数据集中有11个依赖于事实核查报告中“泄露”的证据,而这些证据在索赔出现时并不存在。
第四章:经济
几乎所有美国工业部门对人工智能相关专业技能的需求都在增长;在美国所有有数据的部门(农业、林业、渔业和狩猎除外),与人工智能相关的职位发布数量平均从2021年的1.7%增加到2022年的1.9%。
美国的雇主正在越来越多地寻找具有人工智能相关技能的工人;过去十年来,私人在人工智能方面的投资首次同比下降。2022年,全球人工智能私人投资为919亿美元,较2021年下降了26.7%。与人工智能相关的融资事件总数以及新融资的人工智能公司数量也同样减少。尽管如此,在过去十年中,人工智能投资大幅增加。2022年,私人对人工智能的投资数量是2013年的18倍。
美国在人工智能方面的投资再次处于领先地位;美国在人工智能私人投资总额方面领先于世界。2022年,在美国投资的474亿美元,大约是在排名第二高的国家中国(134亿美元)的3.5倍。在新投资的人工智能公司总数方面,美国也继续领先,是欧盟和英国的总和的1.9倍,是中国的3.4倍。
2022年,投资最多的人工智能重点领域是医疗和医疗保健(61亿美元);其次是数据管理、处理和云计算(59亿美元);和金融科技(55亿美元)。然而,与人工智能私人投资的更广泛趋势相一致,大多数人工智能重点领域在2022年的投资少于2021年。去年,最大的三场人工智能私人投资活动是:(1)中国电动汽车制造商广汽新能源汽车获得25亿美元融资;(2)为军事机构和边境监控技术的美国国防产品公司提供15亿美元的E轮融资;(3)向德国商业数据咨询公司Celonis投资12亿美元。
虽然采用人工智能的公司比例已经趋于稳定,但采用人工智能的公司仍在继续领先;麦肯锡的年度研究调查结果显示,自2027年以来,采用人工智能的公司在2027年的比例增加了一倍多,尽管近年来已稳定在50%至60%之间。采用人工智能的组织报告称,实现了有意义的成本下降和收入增加。
企业正在以多方面的方式部署人工智能;最有可能嵌入到企业中的人工智能能力包括机器人过程自动化(39%)、计算机视觉(34%)、NL文本理解(33%)和虚拟代理(33%)。此外,2022年最常采用的人工智能用例是服务运营优化(24%),其次是创建新的基于人工智能的产品(20%)、客户细分(19%)、客户服务分析(19%)和新的基于人工智能的产品增强功能(19%)。
像副驾驶这样的人工智能工具完全可以帮助工人;GitHub调查的结果显示,88%的受访者在使用该系统时感到更有效率,74%的人认为他们能够专注于更令人满意的工作,88%的人认为他们能够更快地完成任务。
中国主导着工业机器人的安装;2013年,中国超过了日本,成为安装工业机器人最多的国家。从那以后,中国安装的工业机器人总数与邻近国家之间的差距扩大。2021年,中国安装的工业机器人数量超过了世界其他地区的总和。
第五章教育
越来越多的人工智能专业化;2021年,美国大学计算机科学专业博士毕业生的比例从2020年的14.9%和2010年的10.2%跃升至2021年的19.1%。
新的人工智能博士越来越走向工业;2011年,人工智能博士毕业生在工业界工作的比例(40.9%),与学术界(41.6%)大致相同。然而,从那以后,大多数人工智能博士都进入了工业行业。2021年,65.4%的人工智能博士在工业界工作,是28.2%在学术界工作的两倍多。
新的北美CS、CE和信息教员的招聘保持不变;在过去的十年里,北美计算机科学(CS)、计算机工程(CE)和信息教师的招聘总数有所下降:2021年为710人,而2012年为733人。同样,终身教职员工总数在2019年达到了422人,然后在2021年下降到324人。
美国私人与公共CS部门的外部研究资金差距继续扩大;2011年,美国私人和公共CS部门用于计算研究的外部总支出中位数大致相同。从那以后,差距扩大了,美国的私立计算机计算机系比公立大学多获得了数百万美元的额外资金。2021年,私立大学的支出中值为970万美元,而公立大学为570万美元。
美国和世界其他地区对K-12人工智能和计算机科学教育的兴趣都在增长;2021年,美国学生共参加了181,040次AP计算机科学考试,较上年增长1.0%。自2007年以来,AP计算机科学考试的数量增加了九倍。截至2021年,包括比利时、中国和韩国在内的11个国家已经正式批准并实施了K-12人工智能课程。
第六章:政策与治理
决策者对人工智能的兴趣正在上升;一项对127个国家立法记录的人工智能指数分析显示,通过成为法律的包含“人工智能”的法案数量从2016年的仅1项增加到2022年的37项。对81个国家关于人工智能的议会记录的分析同样显示,自2016年以来,在全球立法程序中提到人工智能的次数增加了近6.5倍。
从谈判到制定——美国通过的人工智能法案比以往任何时候都多;2021年,美国所有联邦人工智能法案中只有2%被通过成为法律。这一数字在2022年跃升至10%;同样,去年有35%的州一级人工智能法案被通过成为法律。
说到人工智能,政策制定者们有很多想法;对不同国家群体的议会进程进行的定性分析显示,政策制定者从广泛的角度考虑人工智能。例如,2022年,英国的立法者讨论了人工智能主导自动化的风险;日本人认为在面对人工智能时保护人权的必要性;赞比亚的人研究了使用人工智能进行天气预报的可能性。
美国政府继续增加在人工智能方面的支出;自2017年以来,美国政府与人工智能相关的合同支出增加了约2.5倍.法律界正在意识到人工智能。2022年,美国州法院和联邦法院有110起与人工智能相关的法律案件,大约是2016年的7倍。这些案件大多起源于加利福尼亚州、纽约州和伊利诺斯州,涉及民事、知识产权和合同法等问题。
法律界正在意识到人工智能;2022年,美国州法院和联邦法院有110起与人工智能相关的法律案件,大约是2016年的7倍。这些案件大多起源于加利福尼亚州、纽约州和伊利诺斯州,涉及民事、知识产权和合同法等问题。
第七章:多样性
北美的学士、硕士和博士水平的计算机科学学生正变得更加种族多样化;尽管白人学生在新常驻学士、硕士和博士学位的计算机科学毕业生中仍然是最具代表性的种族,但来自其他种族背景(例如,亚裔、西班牙裔、黑人或非裔美国人)的学生的比例越来越高。例如,2011年,71.9%的新住院CS学士毕业生是白人。到2021年,这一数字降至46.7%。
新获得的人工智能博士仍然绝大多数是男性;2021年,78.7%的新人工智能博士为男性。只有21.3%为女性,比2011年增加了3.2个百分点。在更高层次的人工智能教育中,仍然存在着性别失衡。女性在CS、CE和信息教师的招聘中所占的比例越来越大。
自2017年以来,新女性CS、CE和信息教师的招聘比例从24.9%上升到30.2%;尽管如此,北美大学的大多数CS、CE和信息学院都是男性(75.9%)。截至2021年,只有0.1%的CS、CE和信息教师认为这是非二进制的。
美国的K-12计算机科学教育在性别和种族方面已经变得更加多样化;女学生参加AP计算机科学考试的比例从2007年的16.8%上升到2021年的30.6%。同样,亚裔、西班牙裔、拉丁裔和黑人/非裔美国学生的比例也有所增加。
第八章舆论
中国公民是那些对人工智能产品和服务感觉最积极的人之一;美国人……并没有那么多。在2022年IPSOS的一项调查中,78%的中国受访者(受访国家的比例最高)同意这样一种说法,即使用人工智能的产品和服务利大于弊。在中国的受访者之后,来自沙特阿拉伯(76%)和印度(71%)的受访者对人工智能产品感到最为积极。只有35%的抽样美国人(在被调查国家中最低的国家中)认为,使用人工智能的产品和服务利大于弊。
男性往往比女性对人工智能产品和服务的感觉更积极;男性也比女性更有可能相信人工智能主要是帮助而不是伤害。根据2022年IPSOS的调查,男性比女性更有可能报告人工智能产品和服务让他们的生活变得更容易,信任使用人工智能的公司,并认为人工智能产品和服务利多于弊。盖洛普和劳埃德船级社基金会在2021年进行的一项调查同样显示,男性比女性更有可能同意这样一种说法,即在未来20年里,人工智能将主要帮助而不是伤害他们的国家。
世界各地的人,尤其是美国各地的人,仍然不相信自动驾驶汽车;在一项全球调查中,只有27%的受访者表示在自动驾驶汽车中感到安全。同样,皮尤研究表明,只有26%的美国人认为无人驾驶乘用车对社会来说是个好主意。
引起兴奋和关注的不同原因;在接受调查的美国人样本中,那些对人工智能感到兴奋的是改善生活和社会(31%)、节省时间和提高效率的潜力(13%)。那些报告感到更担心的人担心失业(19%);监视、黑客攻击和数字隐私(16%);以及缺乏人际关系(12%)。
NLP研究者……也有一些强烈的观点;根据一项广泛分发给NLP研究人员的调查,77%的人同意或不同意私人人工智能公司的影响力太大,41%的人认为NLP应该受到监管,73%的人认为人工智能可能很快导致革命性的社会变革。这些都是NLP研究界所持有的许多强烈观点中的一些。
2023年人工智能指数报告
第一章:研究与开发
概述
本章介绍了人工智能研发的发展趋势。它首先检查人工智能出版物,包括期刊文章、会议论文和存储库。接下来,它考虑重要机器学习系统的数据,包括大型语言和多模态模型。最后,本章最后了人工智能会议出席率和开源人工智能研究。尽管美国和中国继续主导着人工智能的研发,但研究工作在地理上却越来越分散。
本节借鉴了来自乔治敦大学安全和新兴技术中心(CSET)的数据。CSET维护了一个合并的学术文献语料库,包括数字科学的维度、克拉维特的科学网、微软学术图、中国国家知识基础设施、arXiv和代码论文。在该语料库中,CSET应用了一个分类器来识别与2010年以来AI和ML的开发或应用相关的英语出版物。在今年的报告中,CSET还使用了选定的中文人工智能关键词来识别中文人工智能论文;CSET没有在之前的人工智能指数报告中使用这种方法。在去年的报告中,出版趋势被报告到2021年。然而,考虑到有一个显著滞后的出版元数据的集合,在某些情况下需要直到任何给定的中间完全捕获前一年的出版物,在今年的报告中,人工智能指数团队当选检查出版趋势只有到2021年,我们,连同CSET,相信收益率更完全具有代表性的报告。
1.1出版物
回顾
下图按类型、隶属关系、跨国合作和跨行业合作列出了 2010 年至 2021 年全球范围内英文和中文 AI 出版物的总数。该部分还按地区细分了 AI 期刊文章、会议论文、存储库和专利的出版和引用数据。
图1.1.1显示了世界上人工智能出版物的数量。从2010年到2021年,人工智能出版物的总数增加了一倍多,从2010年的20万份增长到2021年的近50万份。
资料来源:美国安全与新兴技术中心,2022年|图表:2023年人工智能指数报告
图1.1.1
有关CSET的方法的更多信息,请参见附录。有关定义人工智能和正确捕获相关文献计量数据的更多挑战,请参阅AI索引团队在论文“人工智能政策中的测量:机会和挑战”中的讨论。
按出版物类型
图 1.1.2 显示了随着时间的推移全球发布的人工智能出版物的类型。2021 年,所有已发表的 AI 文档中有 60% 是期刊文章,17% 是会议论文,13% 是存储库提交。书籍、书籍章节、论文和未知文档类型”构成了其余 10% 的出版物。虽然在过去 12 年中,期刊和知识库出版物分别增长了 3 倍和 26.6 倍,但会议论文的数量自 2019 年以来有所下降。
资料来源:美国安全与新兴技术中心,2022年|图表:2023年人工智能指数报告
图 1.1.2
根据研究领域
图1.1.3显示,模式识别和机器学习方面的出版物在过去五年中经历了最快的增长。自2015年以来,模式识别论文的数量大约增加了一倍,而机器学习论文的数量大约增加了两倍。继这两个主题领域之后,在2021年,仅次于最多发表的人工智能研究领域是计算机视觉(30075)、算法(21527)和数据挖掘(19181)。
按研究领域分类-人工智能出版物数量(不包括其他人工智能),2010-21年资料来源:美国安全与新兴技术中心,2022年|图表:2023年人工智能指数报告。
图1.1.3
按部门划分
本部分显示了隶属于教育、政府、工业、非营利组织和其他部门的人工智能出版物的数量——首先是全球(图1.1.4),然后是美国、中国、欧盟和英国(图1.1.5)。教育部门在每个地区占主导地位。行业参与水平在美国最高,然后是在欧盟。自2010年以来,人工智能出版物的份额一直在下降。
2010-2021年按各部门划分的人工智能出版物(占总数的%)
资料来源:安全与新兴技术中心。2022年|图表:2023年人工智能指数报告
图1.1.4
2021年按部门和地理区域划分的人工智能出版物(占总数的%)
(资料来源:安全与新兴技术中心,2022年|图表:2023年人工智能指数报告)
图1.1.5
跨国合作
学者、研究人员、行业专家和其他人士之间的跨境合作是现代STEM(科学、技术、工程和数学)发展的关键组成部分,它加速了新想法的传播和研究团队的发展。图1.1.6和1.1.7描述了2010年至2021年期间最热门的跨国人工智能合作项目。CSET将跨国合作计算为每个出版物的作者之间的不同国家对(例如,单一出版物上的4名美国和4名中国附属作者被视为一个U.S.-China合作;同一作者之间的两篇出版物被视为两次合作)。
到目前为止,过去12年里最多的合作发生在中美两国之间,自2010年以来增加了大约4倍。然而,从2020年到2021年,U.S.-China合作的总数仅增长了2.1%,这是自2010年以来的最低同比增长率。第二大合作是英国和中国和美国之间的合作。2021年,中美两国的合作数量是英中两国的2.5倍。
2010-21年美国和中国的人工智能出版物合作
(资料来源:安全与新兴技术中心,2022年|图表:2023年人工智能指数报告)
图1.1.6
2010-21年人工智能出版物中的跨界合作(不包括美国和中国)
(资料来源:安全与新兴技术中心,2022年|图表:2023年人工智能指数报告)
图1.1.7
跨部门协作
学术界以外的人工智能研究的增加扩大并扩大了各个部门的合作。图1.1.8显示,2021年教育机构和非营利组织(32551)合作次数最多;其次是工业和教育机构(12856);教育和政府机构(8913)。教育机构和工业之间的合作增长最快,自2010年以来增长了4.2倍。
图1.1.8
人工智能期刊出版物
要点
在2010年至2015年仅略有增长之后,人工智能期刊的出版物数量自2015年以来增长了约2.3倍。从2020年到2021年,它们增长了14.8%(图1.1.9)。
2010-21年人工智能期刊出版物的数量
(资料来源:美国安全与新兴技术中心,2022年|图表:2023年人工智能指数报告)
图1.1.9
按区域
图1.1.10显示了2010年至2021年期间按地区划分的人工智能期刊出版物的份额。2021年,东亚和太平洋地区以47.1%的比例领先,其次是欧洲和中亚(17.2%),其次是北美(11.6%)。自2019年以来,来自东亚和太平洋地区的出版物份额;欧洲和中亚;以及北美也一直在下降。在此期间,来自南亚等其他地区的出版物有所增加;以及中东和北非。
2010-21年各地区分列的人工智能期刊出版物(占世界总数的%)
(资料来源:美国安全与新兴技术中心,2022年|图表:2023年人工智能指数报告)
图1.1.10
按地理区域
图1.1.11按地理区域划分了过去12年人工智能期刊出版物的份额。今年的人工智能指数让印度认识到它在人工智能生态系统中扮演着越来越重要的角色。中国一直以来都保持着领先地位,2021年为39.8%,其次是欧盟和英国(15.1%),然后是美国(10.0%)。印度出版物的市场份额一直在稳步增长,从2010年的1.3%上升到2021年的5.6%。
2010-21年按地理区域划分的人工智能期刊出版物(占世界总数的%)
(资料来源:美国安全与新兴技术中心,2022年|图表:2023年人工智能指数报告)
图1.1.11
引用
自2010年以来,中国在人工智能期刊出版物中的被引用比例逐渐上升,而欧盟、英国以及美国的被引用比例则有所下降(图1.1.12)。中国、欧盟、英国、美国占世界总引用量的65.7%。
2010-21年按地理区域划分的人工智能期刊引用量(占世界总数的%)
(资料来源:美国安全与新兴技术中心,2022年|图表:2023年人工智能指数报告)
图1.1.12
人工智能会议出版物
要点
人工智能会议上的出版物数量在2019年达到顶峰,比2021年的峰值下降了20.4%(图1.1.13)。2021年人工智能会议的出版物总数为85,094份,略高于2010年的75,592份。
2010-21年人工智能会议出版物数量
(资料来源:美国安全与新兴技术中心,2022年|图表:2023年人工智能指数报告)
图1.1.13
按区域
图1.1.14显示了按地区划分的人工智能会议出版物的数量。与东亚和太平洋地区的期刊出版物的趋势一样;欧洲和中亚;而北美是世界上人工智能会议出版物数量最多的国家。具体来说,东亚和太平洋地区的所占份额继续上升,2021年占36.7%,其次是欧洲和中亚(22.7%),然后是北美(19.6%)。在过去的12年里,南亚的人工智能会议出版物的比例显著上升,从2010年的3.6%增长到2021年的8.5%。
2010-21年按地区分列的人工智能会议出版物(占世界总数的百分比)
(资料来源:美国安全与新兴技术中心,2022年|图表:2023年人工智能指数报告)
图1.1.14
按地理区域
2021年,中国在全球人工智能会议出版物中所占的份额最大,达到26.2%,在2017年超过了欧盟和英国。欧盟和英国紧随其后,为20.3%,美国以17.2%位居第三(图1.1.15)。与研发部分其他部分的趋势相反,印度的人工智能会议出版物的份额也在增加。
2010-21年按地理区域划分的人工智能会议出版物(占世界总量的%)
(资料来源:美国安全与新兴技术中心,2022年|图表:2023年人工智能指数报告)
图1.1.15
引用
尽管中国在2021年出版的人工智能会议出版物最多,但图1.1.16显示,美国的人工智能会议被引用份额最大,为23.9%,其次是中国的22.0%。然而,美国和中国人工智能会议引用的差距正在缩小。
2010-21年按地理区域划分的人工智能会议引用量(占世界总数的%)
(资料来源:美国安全与新兴技术中心,2022年|图表:2023年人工智能指数报告)
图1.1.16
人工智能存储库
要点
发布关于电子预印本存储库(如arXiv和SSRN)的预同行评议论文已成为人工智能研究人员在传统出版途径之外传播其工作的一种流行方式。这些存储库允许研究人员在将其提交给期刊和会议之前分享他们的发现,从而加快了信息发现的周期。在过去的12年里,人工智能存储库出版物的数量增长了近27倍(图1.1.17)。
2010-21年人工智能知识库出版物的数量
(资料来源:美国安全与新兴技术中心,2022年|图表:2023年人工智能指数报告)
图1.1.17
按区域
图1.1.18显示,自2016年以来,北美地区在全球人工智能存储库出版物的市场份额上一直保持着稳定的领先地位。自2011年以来,来自欧洲和中亚的知识库出版物的份额有所下降。自2010年以来,东亚和太平洋地区所代表的份额显著增长,并从2020年至2021年继续增长,在这期间,北美以及欧洲和中亚资料库出版物的份额同比下降。
2010-21年按各地区分列的人工智能知识库出版物(占世界总数的%)
(资料来源:美国安全与新兴技术中心,2022年|图表:2023年人工智能指数报告)
图1.1.18
按地理区域
自2016年以来,美国在全球人工智能知识库出版物的比例上一直保持领先,而中国正在迎头赶上,而欧盟和英国的份额则在继续下降(图1.1.19)。2021年,美国占世界人工智能存储库出版物的23.5%,其次是欧盟和英国(20.5%),然后是中国(11.9%)。
2010-21年按地理区域划分的人工智能知识库出版物(占世界总量的%)
(资料来源:美国安全与新兴技术中心,2022年|图表:2023年人工智能指数报告)
图1.1.19
引用
在人工智能知识库出版物的引用中,图1.1.20显示,2021年,美国以29.2%的总引用量位居榜首,保持领先于欧盟和英国(21.5%)和中国(21.0%)。
2010-21年按地理区域划分的人工智能存储库引用(占世界总数的百分比)
(资料来源:美国安全与新兴技术中心,2022年|图表:2023年人工智能指数报告)
图1.1.20
顶级出版机构
自2010年以来,产生人工智能论文总数最多的机构一直是中国科学院(图1.1.21)。排名前四名的都是中国大学:清华大学、中国科学院大学、上海交通大学和浙江大学。这些机构在2021年发布的出版物总数如图1.1.22所示。
2010-21年,按各领域的人工智能出版物数量排名,2021年世界十大机构
(资料来源:美国安全与新兴技术中心,2022年|图表:2023年人工智能指数报告)
图1.1.21
图1.1.22
计算机视觉
2021年,人工智能计算机视觉出版物出版数量最多的十大机构均为中文机构(图1.1.23)。中国科学院发表的此类出版物数量最多,共计562篇。
2021年计算机视觉人工智能出版物数量排名世界十大机构
(资料来源:美国安全与新兴技术中心,2022年|图表:2023年人工智能指数报告)
图1.1.23
自然语言处理
美国机构在顶级NLP出版商中所占的比例更大(图1.1.24)。尽管中国科学院在2021年再次成为世界领先的机构(182份出版物),但卡内基梅隆大学排名第二(140份出版物),其次是微软(134份)。此外,2021年是亚马逊和阿里巴巴首次跻身全球十大出版NLP机构的行列。
2021年按自然语言处理领域的人工智能出版物数量排名世界十大机构
(资料来源:美国安全与新兴技术中心,2022年|图表:2023年人工智能指数报告)
图1.1.24
语音识别
2021年,语音识别论文主要来自中国科学院(107篇),其次是微软(98篇)和谷歌(75篇)(图1.1.25)。2021年,中国科学院从微软手中夺回了榜首的位置。
2021年,按语音识别领域的人工智能出版物数量排名世界十大机构
(资料来源:美国安全与新兴技术中心,2022年|图表:2023年人工智能指数报告)
图1.1.25
Epoch人工智能是一个研究和预测先进人工智能发展的研究人员的集体。Epoch管理了一个自20世纪50年代以来发布的重要人工智能和机器学习系统的数据库。Epoch团队决定在其数据库中包含特定的人工智能系统有不同的标准;例如,该系统可能已经注册了最先进的改进,被认为具有历史意义,或被高度引用。本小节使用Epoch数据库来跟踪重要的人工智能和机器学习系统的趋势。本章的后半部分包括人工智能索引团队所做的研究,该研究以大型语言和多模态模型报告趋势,这些模型是经过大量数据训练的模型,并适用于各种下游应用程序。