近日,美国斯坦福大学的“以人为本”人工智能研究所(Stanford HAI),在华裔女科学家李飞飞等人的共同领导下,发布了一份名为《2024年人工智能指数报告》(Artificial Intelligence Index Report 2024)的研究报告。报告揭示了 2023 年人工智能行业的10大主要趋势:
1.人工智能在某些任务上胜过人类,但并非在所有任务上。人工智能已在多项基准测试中超越人类,包括在图像分类、视觉推理和英语理解方面。然而,它在竞赛级数学、视觉常识推理和规划等更复杂的任务上依然落后于人类。
2.产业界继续主导人工智能前沿研究。2023年,产业界产生了51个著名的机器学习模型,而学术界只贡献了15个。2023年,产学合作还产生了21个著名模型,创下新高。此外,108个新发布的基础模型来自工业界,28个来自学术界。
3.前沿大模型变得更加昂贵。根据 AI Index 的估算,最先进的人工智能模型的训练成本已经达到了前所未有的水平。例如,OpenAI的 GPT-4 估计使用了价值7800万美元的计算资源进行训练,而谷歌的 Gemini Ultra 的计算成本则高达1.91亿美元。相比之下,几年前发布的一些最先进的模型,即原始transformer模型(2017年)和 RoBERTa Large(2019年),训练成本分别约为900美元和16万美元。
4.美国成为顶级人工智能模型的主要来源国。2023 年,61 个著名的人工智能模型源自美国的机构,超过欧盟的 21 个和中国的15个。
2023年各地区著名的大模型数量
美国也仍然是人工智能投资的首选之地。2023年,美国在人工智能领域的私人投资总额为672亿美元,是中国的近9倍。然而,中国依然是美国最大的竞争对手,中国的机器人安装量居世界首位;同样,世界上大多数人工智能专利(61%)都来自中国。
2023年不同地区的AI私人投资
5.严重缺乏对LLM责任的可靠和标准化评估。AI Index 的最新研究显示,负责任的人工智能严重缺乏标准化。包括OpenAI、谷歌和Anthropic在内的领先开发商主要根据不同的负责任人工智能基准测试他们的模型。这种做法使系统地比较顶级人工智能模型的风险和局限性的工作变得更加复杂。
6.生成式人工智能投资激增。尽管去年人工智能私人投资整体下降,但对生成式人工智能的投资激增,比2022年(约30亿美元)增长了近八倍,达到252亿美元。生成式人工智能领域的主要参与者,包括OpenAI、Anthropic、Hugging Face和 Inflection,都获得了一轮可观的融资。
生成式人工智能领域的私人投资
7.数据显示,人工智能让“打工人”更有生产力,工作质量更高。2023年,多项研究评估了人工智能对劳动力的影响,表明人工智能可以让打工人更快地完成任务,并提高他们的产出质量。这些研究还表明,人工智能有可能缩小低技能和高技能工人之间的技能差距。还有一些研究警告说,在没有适当监督的情况下使用人工智能可能会起到负面作用。
8.得益于人工智能,科学进步进一步加速。2022 年,人工智能开始推动科学发现。然而,2023 年,与科学相关的更重要的人工智能应用启动——使算法排序更高效的 AlphaDev、促进材料发现过程的 GNoME、可在一分钟内提供极其准确的 10 天天气预报的 GraphCast、成功对 7100 万种可能的错义突变中的约 89% 进行分类的 AlphaMissence。如今,人工智能现在可以完成人类难以完成的、但对解决一些最复杂的科学问题至关重要的粗暴计算。在医疗方面,新的研究表明,医生可以利用人工智能更好地诊断乳腺癌、解读X射线和检测致命的癌症。
9.美国的人工智能法规数量急剧增加。2023年,全球立法程序中有2175次提及人工智能,几乎是上一年的两倍。美国人工智能相关法规的数量在过去一年大幅增加。2023年,与人工智能相关的法规有25项,而2016年只有1项。仅去年一年,人工智能相关法规的总数就增长了56.3%。其中一些法规包括生成式人工智能材料的版权指南和网络安全风险管理框架。
2016-2023年美国AI相关的法规数量
10.公众对人工智能影响的认知与焦虑有所上升。益普索(Ipsos)的一组纵向调查数据剖析了全球公众对人工智能的态度:66%的受访者认为,人工智能发展将对生活将产生重大影响;52%的受访者对人工智能产品和服务表示紧张,比2022年上升了13个百分点。皮尤研究中心(Pew Research Center)的数据显示,52%的美国人对人工智能的担忧多于兴奋,相较于2022年的38%有所上升。报告还调查了受访者对人工智能的具体担忧内容,在全球范围内,受访者最担心人工智能被滥用于恶意目的(49%)和给工作带来的影响(49%);相较之下,受访者对人工智能潜在的偏见和歧视(24%)以及自身使用人工智能的能力(22%)等问题的关注程度较低。