《财经研究》
2026第52卷第5期
大语言模型对劳动力需求的影响——基于上市公司招聘数据的研究
廖婉晴 , 郭允航 , 赵楠     
北京师范大学 统计学院,北京 100875
摘要: 作为新一代人工智能技术,大语言模型可能会改变劳动力市场的格局。文章基于中文大语言模型发布前后一年的上市公司在线招聘大数据,结合 BERT 模型和连续双重差分模型,深入探究了大语言模型对我国不同维度劳动力需求的影响。文章研究发现,大语言模型改变了我国劳动力需求结构,显著提高了互补型职业的招聘占比;大语言模型提高了企业招聘的薪资水平、学历要求及工作年限门槛,且资源禀赋更加充裕的公司招聘条件涨幅更为明显,这一趋势可能加剧不同技能水平劳动力之间的就业差距;大语言模型增加了劳动力认知技能以及非常规认知任务的需求,并从技能和任务的双重视角解释了需求变化的内在机制。文章的研究丰富了人工智能对劳动力市场影响的现有成果,为推动生成式人工智能时代的高质量就业、实现劳动力市场均衡发展提供了经验依据。
关键词: 大语言模型    劳动力需求    招聘数据    
The Impact of Large Language Models on Labor Demand: Evidence from Recruitment Data of Listed Companies
Liao Wanqing, Guo Yunhang, Zhao Nan     
School of Statistics, Beijing Normal University, Beijing 100875, China
Summary: Large language models (LLMs), as a new generation of artificial intelligence (AI), are reshaping production and labor market structures. Existing studies mainly focus on aggregate effects in developed countries, with limited causal and structural evidence for China, and little analysis of mechanisms from the perspectives of skills, tasks, and firm heterogeneity. This paper provides empirical evidence from the Chinese context to inform high-quality employment and balanced labor market development in the era of generative AI. This paper uses over 550,000 online recruitment postings from listed companies between January 2022 and March 2024, combining a BERT model with a continuous DID approach to examine the multidimensional impact of LLMs on labor demand. The results show no significant impact on total hiring in the short run, but a clear increase in the share of complementary occupations, along with higher wages, educational requirements, and experience thresholds. Mechanism testing indicates increased demand for advanced cognitive skills, agreeableness, and non-routine cognitive tasks, and reduced demand for extraversion and emotional stability; these shifts lead firms to raise hiring standards. Heterogeneity analysis shows that large, profitable, and cash-rich firms adjust requirements more strongly, potentially widening inter-firm disparities. Based on these findings, this paper proposes four policy recommendations: Implement AI-oriented reskilling programs to strengthen advanced cognitive skills and human–AI collaboration capabilities; improve employment protection for workers affected by technological shocks by establishing risk monitoring systems and promoting skill-based hiring mechanisms; reform the education system to adapt to technological changes by integrating digital literacy and AI knowledge; and adopt differentiated firm support policies to reduce the cost of AI adoption for small and medium-sized enterprises. This paper makes the following contributions: First, it provides causal evidence on the LLM impact in China using a continuous DID framework. Second, it extends analysis from quantity to quality of labor demand and distinguishes complementary and substitutable occupations. Third, it identifies mechanisms from both skill and task perspectives, offering micro-level evidence on labor market transformation in the era of generative AI.
Key words: large language models    labor demand    recruitment data    

一、引 言

近年来,以 ChatGPT 为代表的大语言模型在全球迅速崛起,成为推动新一轮技术革命与产业变革的核心力量。与传统的信息化和自动化技术相比,大语言模型不仅在文本生成、翻译和信息检索等任务上具有卓越能力,更在逻辑推理、知识整合和跨领域应用中表现出广泛的适应性,被越来越多的学者视为一种“通用目的技术”。这一新兴技术的迭代速度和应用扩散程度远超以往的信息化浪潮,正在深刻改变社会生产方式和组织形态。我国同样将大语言模型视为新质生产力的重要组成部分,自 2023 年以来密集出台了《生成式人工智能服务管理暂行办法》《国务院关于深入实施“人工智能+”行动的意见》等多项文件,将人工智能与大语言模型发展纳入重要发展战略。

在此背景下,大语言模型对劳动力市场需求的影响研究成为国内外经济学研究的重点议题。与以往的人工智能技术相同,该影响具有两面性:一方面,大语言模型可以通过提升劳动力生产率和促进产业升级,推动劳动力总体需求增长;另一方面,大语言模型对大量标准化任务具有替代效应,这可能减少某些职业的就业机会,从而引发“技术性失业”。具有不同技能的劳动力受到的影响也可能存在差异,劳动力市场结构会发生较大改变,并可能影响职业内部和职业之间的不平等。因此,大语言模型对劳动力需求的影响存在不确定性,需要结合经验进行深入研究。

尽管已有文献围绕人工智能的影响进行了探讨,但对大语言模型的研究尚在起步阶段。鉴于大语言模型具备打破场景壁垒的通用语义理解能力与颠覆性内容生成潜力,与先前的技术可能有本质的区别(Capraro等,2024),因此需要引起重视并单独讨论。此外,目前少量针对大语言模型的经验研究仅仅对职业暴露度进行测度分析,缺乏对发展中国家的因果效应讨论及需求结构变化的研究。不同国家的劳动力市场技能和任务结构具有较大差异,并且技术冲击对不同劳动力群体的作用存在非对称性(Chen等,2025)。因此,大语言模型也将对我国劳动力市场需求结构产生较大影响。

基于此,本文采用2022 年 1 月至 2024 年 3 月超 55 万条上市公司招聘大数据,结合BERT 模型为每一个招聘岗位匹配了对应的标准化中文职业,并根据Eloundou等(2024)的研究测算了大语言模型暴露度,通过双重差分法探究了大语言模型对不同维度招聘需求的总体影响,讨论了不同技能和任务的需求变化。研究发现,大语言模型对招聘总量需求无明显影响,显著增加了互补型职业的需求,提高了招聘薪资水平、学历要求及工作年限门槛。其原因在于:高阶认知技能及非常规认知任务的需求增加改变了招聘市场的筛选信号,企业通过提高招聘要求以确保劳动者能快速适应工作,并通过提高薪资进行补偿。此外,大规模、资金充足的企业招聘薪资和门槛涨幅更高,更易吸引与大语言模型互补的高技能人才,因此可能拉大企业间发展差距,从而导致市场竞争力下降。

与以往研究相比,本文的创新之处主要体现在以下三个方面:第一,在研究视角上,现有文献关于信息化技术和自动化技术对劳动力市场的影响进行了大量研究。例如,大量研究探讨了互联网使用、工业机器人应用对就业规模、技能结构、工资差距等的影响,但较少涉及大语言模型等生成式人工智能技术。本文采用连续双重差分模型探究了大语言模型对我国劳动力需求的因果效应,丰富了大语言模型与发展中国家劳动力市场关系的研究,为探究新型人工智能技术的经济社会影响提供了可借鉴的分析框架。第二,在研究维度上,大语言模型相关研究多局限于劳动力需求总量的讨论,忽视了与劳动力福利相关的薪酬、人力资本要求等变化,也极少关注需求结构的异质性影响。本文不仅将研究维度从总量需求拓展至薪资、学历和工作年限等多重特征,更通过创新性的分类方法探究了互补型与替代型职业的需求分化趋势。本文结论丰富了现有研究关于劳动力需求质量及结构变化的研究。第三,在研究机制上,现有文献虽提及技术进步对技能需求的影响,但较多只是采用学历衡量技能高低,很少将工作技能与任务区分开。本文则基于信号理论、学习结果分类理论、大五人格理论等经典理论,分析了大语言模型对不同维度技能与任务需求的影响,进一步揭示了大语言模型影响劳动力市场的内在机制,为理解生成式人工智能时代劳动力市场的供需匹配问题提供了经验证据。

二、理论分析与研究假设

(一)大语言模型的内涵与特征

大语言模型是人工智能领域的一种先进的自然语言处理技术,具备推理、规划、决策等能力,能够通过处理和生成具有连贯表达的文本,完成翻译、信息检索、对话交互等多种任务。

与以往的人工智能技术相比,大语言模型的核心优势主要体现为三个方面:一是高度普适性和灵活性。传统技术通常仅能适配单一领域任务,跨场景应用的训练成本较高。而大语言模型利用海量数据不仅可以处理语言的基本模式,还能够分析复杂的上下文关系,从而具备跨任务迁移能力(Brown等,2020)。二是技术动态互补性。计算机视觉、语音识别等传统人工智能技术多为单一功能模板,难以协同完成复杂任务。而大语言模型通过大规模的训练与学习,可以直接从原始数据中提取知识和规律(Devlin等,2019)。这种方式不仅减少了对人力的依赖,还使大语言模型能够和其他类型的深度学习技术协同工作。例如,通过将大语言模型与图像生成模型结合,可以实现文本生成与图像创作的无缝连接,进一步扩展人工智能的应用(Ramesh等,2021)。三是创新推动性。传统技术以预测和分类为主,而大语言模型能够自动生成连贯的新闻报道、创作诗歌,甚至能够辅助编程,这一创新性的突破不仅拓展了人工智能的应用领域,也为教育、科研等领域带来了较大变革(Epstein和Hertzmann,2023)。

综上所述,大语言模型不仅重塑了自然语言处理领域的技术格局,更突破了传统人工智能技术的应用界限,其应用场景覆盖各行各业。

(二)大语言模型对劳动力市场需求的影响

目前,学术界对于大语言模型如何影响劳动力市场需求尚未达成一致结论,其核心争议在于技术带来的替代效应与互补效应问题。从理论上来看,大语言模型的高度普适性使其能够影响各行各业的核心业务流程,而非局限于特定领域的辅助环节,此技术扩散特征打破了传统自动化技术的局限,使得不同类型的劳动力都可能受到冲击。具体来看,不同职业与技术的互动关系呈现出明显的差异化重构:对于标准化、重复性强的文本处理类职业,大语言模型能够独立完成核心任务,且在效率、准确性上不亚于人类,从而形成直接的替代效应(Eloundou等,2024);对于需要复杂决策、深度人际交互或创意整合的职业,其动态互补性能够辅助劳动者处理重复性工作、提供决策参考,从而提升工作效率,形成人机协同的互补效应(Brynjolfsson等,2025)。大语言模型的创新推动性还促使企业拓展新的业务场景和开发新的产品与服务,进而创造出大模型应用顾问等新职业。这些新职业以人机协同为核心,专门围绕大语言模型的训练优化、应用落地、效果评估等环节开展工作,进一步丰富了劳动力市场的职业结构。因此,大语言模型对劳动力市场需求的影响并非简单的岗位增减,而是基于其核心技术特质导致的职业需求结构分化。因此,替代效应、互补效应与创造效应的共同作用使得劳动力市场发生较大变化。

理论不确定性使大语言模型对劳动力市场需求的影响成为一个经验问题。现有的实证研究主要可分为两类:一类从职业任务出发,通过文本分析的方式评估了大语言模型对各职业的影响程度,并在此基础上探究了不同人群的大语言模型暴露度。这类文献强调相关性而非因果分析,认为女性、受教育程度较高的劳动力以及工资水平较高的劳动力更容易受大语言模型影响。另一类文献则采用双重差分或事件研究法,通过对职业进行分类来探究大语言模型对就业需求的因果效应。在对职业分类时,通常从以下两个维度进行判断:一是职业任务的可自动化程度,重点分析工作任务能否被算法、软件或硬件替代;二是人机协作关系,聚焦从业者在技术辅助下的工作效率。例如,Demirci等(2025)将岗位按工作任务分为手工密集型、自动化倾向型、图像生成型三大类,发现在 ChatGPT出现后,相比于手工密集型岗位,自动化倾向型和图像生成型岗位需求均有不同幅度的减少。综上所述,我们提出如下假设:

假设 1:大语言模型对总体招聘需求短期无明显影响,但会改变职业需求结构。

技能偏向型技术进步理论认为,技术进步往往会增加高技能劳动力的需求,并通过提高劳动生产率进一步扩大薪资差距。在界定高低技能时,早期研究常以受教育水平作为衡量依据(Graetz和Michaels,2018),随着人力资本理论的发展,认知技能与非认知技能逐渐成为衡量技能水平的重要维度。在认知技能方面,学习结果分类理论将其细分为语言信息、智慧技能和认知策略(Gagné,1985)。大语言模型的高度普适性使其能够处理跨领域的基础文本,从而降低了低阶语言信息技能的重要性,但其动态互补性又要求劳动者具备更高的智慧技能,能运用概念解决复杂问题和整合不同领域知识。例如,Ahmadi等(2024)利用招聘数据考察了大语言模型相关技能的需求变动,发现随着大语言模型与各个行业日益融合,雇主更关注能够与人工智能协作并扩展认知边界的能力,这导致对高阶认知技能的需求显著上升。这与以往研究结论一致,即随着人工智能水平不断发展,越来越多的认知技能存在被替代的风险,因此对认知技能的要求会不断提升。然而非认知技能需求的变化则呈现更大的异质性,这与大语言模型的技术边界和应用场景高度相关。一方面,大语言模型的普适性使其能够承担部分沟通或情境信息加工任务,因此对这些技能的需求相对稳定甚至有减少的趋势(Hering和Rojas,2025);另一方面,有研究认为大语言模型在处理复杂决策以及进行情感交流方面仍然存在明显局限,与之互补的创新领导力、情感智能等技能需求会显著上升(李志和骆行,2025)。

除技能偏向型进步理论外,也有学者基于工作任务的分析框架来解释技术进步对劳动力需求的影响,该框架认为任务是一系列执行单元,而技能是劳动力完成任务需具备的不同能力。通过将任务划分为常规任务和非常规任务两大类,Autor和Dorn(2013)探究了自动化技术对劳动力市场的影响。其中,常规任务通常指那些可通过标准化流程进行重复操作的任务,不需要劳动者进行自主判断或与外部环境进行交互;非常规任务一般无固定流程,需要劳动者在工作过程中运用高阶认知技能或人际交往技能进行灵活处理。现有研究普遍认为,大语言模型对重复性和标准化的常规认知任务替代性更强,与需要劳动力自身经验和批判性思维的非常规任务互补性更强(陈澍等,2025)。综上所述,我们提出以下假设:

假设 2:大语言模型会增加对认知技能及非常规任务的需求,对非认知技能不同维度的需求具有不同的影响。

劳动经济学认为,企业在设定招聘工资、学历和经验要求时面临信息不对称和风险问题。根据Spence(1978)提出的信号理论,当雇主无法直接观察劳动者的边际生产率时,会依赖受教育程度、工作经验等可观测的特征设定工资和招聘条件。当岗位技能和任务组合向更高难度、更复杂的方向发展时,企业倾向于通过调整薪酬和招聘要求来匹配任务的边际产出与风险(Alekseeva等,2021)。一方面,企业可能通过提高员工的工资来补偿更高的边际产出要求;另一方面,企业也可能通过提高学历或经验要求来筛选具备更强认知与学习技能、情境判断能力的应聘者。

大语言模型的核心特质进一步重构了这一筛选机制:首先,其高度普适性降低了技术应用门槛,使企业能快速应用大语言模型优化业务流程,企业对劳动者与大语言模型协同能力的需求成为核心要求。但这种协同能力难以直接观测,企业只能通过学历、工作经验等传统信号来进行间接筛选。其次,创新推动性带来的业务流程变革,使得岗位任务复杂度与价值产出显著提升。企业为匹配更高的边际产出,一方面通过提高薪资补偿劳动者的技能投入;另一方面,通过严格的学历和经验要求筛选高阶技能人才。已有基于招聘数据的研究表明,随着大语言模型的普及,招聘岗位普遍提高了学历和工作年限要求,并且薪资显著上升(Demirci等,2025张丹丹等,2025)。这种趋势不仅有助于提高劳动力的整体素质,也加剧了不同劳动者之间的就业分化问题(蒋为等,2025)。而且,企业资源禀赋差异也会调节这一幅度。大规模、盈利能力较强企业的成本约束更小,其能够更快地运用大语言模型,对高技能劳动力的需求更迫切,因此招聘标准调整幅度更大;小规模、盈利能力较弱的企业由于资源有限,可能采取渐进式的策略,招聘标准的调整较小(张叶青等,2021)。因此,资源约束成为影响大语言模型扩散与劳动力需求调整的核心问题,体现了技术运用过程中企业行为的异质性。综上所述,我们提出以下假设:

假设 3:大语言模型会提高招聘岗位薪资水平、平均学历和经验要求,而资源更充足的企业招聘标准调整更为明显。

三、数据、变量与方法

(一)数据来源

本文所采用的数据来自智联招聘2022年 1 月至2024 年 3 月的上市公司招聘样本。在数据处理过程中,本文剔除了各项指标都相同的重复发布样本,以减少招聘需求的测量误差。此外,为了避免极端值的干扰,本文对连续变量进行了 1% 的缩尾处理。为了测度不同职业的招聘需求及大语言模型暴露度,需要为每一个招聘岗位匹配最接近的标准职业。本文采用文本分析的方法,将每一个招聘岗位对应到《中华人民共和国职业分类大典(2022年版)》(简称《职业大典》)中的一个标准职业细类。具体而言,本文采用预训练的中文BERT模型(Devlin等,2019),计算了招聘数据的岗位描述与《职业大典》各职业细类工作任务的余弦相似度,取相似度最高的职业细类作为该岗位对应的标准职业。为进一步提升分析的准确性,本文还通过人工核验的方式,保留了相似度得分在0.65及以上的样本。

(二)变量界定

1. 被解释变量

本文主要从招聘占比($ Recruit\_ share $)、招聘薪资($ Recruit\_ wage $)、招聘学历($ Edu $)和工作经验($ Experience $)四个维度来衡量不同维度招聘需求变化。

2. 大语言模型暴露度

本文采用Eloundou等(2024)测算的大语言模型暴露度来衡量不同职业受大语言模型的影响程度。为了能和中国标准职业细类进行匹配,本文依据O*NET-SOC 2019 和《职业大典》中的职业名称和职业描述,为1636个中国标准职业细类匹配了最相似的职业。结合前文招聘岗位与标准职业细类的匹配结果,本文最终得到了每个岗位的大语言模型暴露度。表1为本文主要变量的描述性统计。其中,样本职业的平均大语言模型暴露度($ LLM\_ exposure $)略高于Eloundou等(2024)测算结果的平均值,说明样本受大语言模型影响较大。

表 1 描述性统计
变量 观测值 均值 标准差 最小值 最大值
$ LLM\_ exposure $ 6699 0.364 0.204 0 1
$ Recruit\_ share $ 6699 0.105 0.307 0.003 2.285
$ Recruit\_ wage $ 6699 9.080 0.408 8.161 10.600
$ Edu $ 6699 13.450 3.918 0 19
$ Experience $ 6699 2.299 1.530 0 10

(三)模型设定

为了探究大语言模型对招聘需求的影响,本文构建了如下的连续双重差分模型(Continuous Difference in Difference Model):

$ \begin{array}{c} {Y}_{iqt}={\beta }_{0}+{\beta }_{1}{LLM\_ exposure}_{i}\times {Post}_{qt}+{\mu }_{i}+{\lambda }_{qt}+{\varepsilon }_{iqt} \end{array} $ (1)

其中,下标$ i $$ q $$ t $分别代表职业细类、季度和年份;$ {Y}_{iqt} $为第$ t $年第$ q $季度第$ i $个职业细类的招聘占比、招聘薪资、招聘学历要求或工作经验要求;$ {LLM\_ exposure}_{i} $为第$ i $个职业细类的大语言模型暴露度;$ {Post}_{qt} $为中文大语言模型是否发布的时间虚拟变量,由于中文大语言模型最早于 2023 年第一季度接入企业,因此该变量在 2023 年第 1季度之后取值为1,其他季度为 0;$ {\mu }_{i} $为职业细类固定效应;$ {\lambda }_{qt} $为年份—季度固定效应;$ {\varepsilon }_{iqt} $为随机扰动项。

四、基准回归

(一)基准回归结果

表2展示了基准回归的估计结果,可以看到大语言模型显著提高了招聘薪资、学历要求和工作经验要求。具体而言,在大语言模型发布后,职业暴露度每提高一个标准差,招聘月薪平均增加约 330元,受教育年限要求平均增加约 0.3 年,工作经验要求平均增加约0.1 年。 1这说明受大语言模型影响,企业在提高招聘薪资的同时也提高了就业门槛,这也意味着只有高学历、工作经验丰富的劳动力才可能受到大语言模型的影响;较低人力资本水平的劳动力可能因大语言模型就业更加困难,这会拉大不同技能群体之间的工资差距,不利于改善收入不平等问题。

表 2 基准回归结果
(1) (2) (3) (4)
$ Recruit\_ share $ $ Recruit\_ wage $ $ Edu $ $ Experience $
$ LLM\_ exposure\times Post $ 0.047 0.181*** 1.452*** 0.473***
(0.036) (0.039) (0.420) (0.178)
职业细类固定效应 控制 控制 控制 控制
年份—季度固定效应 控制 控制 控制 控制
观测值 6699 6699 6699 6699
R2 0.933 0.619 0.574 0.423
  注:******分别表示在10%、5%和1%的显著性水平上显著;括号内是聚类到职业细类的稳健标准误。

基准回归的结果还表明,大语言模型对招聘数量的经济影响并不显著。Eloundou等(2024)测算的大语言模型暴露度是基于职业任务的自动化程度,并不关注人机协作关系。为了区分不同职业与大语言模型的互补程度,进一步识别招聘需求的结构性变化,本文借鉴Jiang等(2025)的做法,利用 ChatGPT 等工具对中国职业细类的每项工作任务进行评分,按照职业的互补性分数是否在中位数以上将样本划分为互补型职业和替代型职业两组,并重新进行回归。根据表3列(1)、列(2)回归结果,互补型职业的招聘占比在大语言模型发布后显著上升,这意味着样本期间大语言模型改变了劳动力市场中的职业需求结构,互补型职业的需求显著提高。这可能是因为我国大多数企业尚未熟练掌握人工智能技术(谭莹等,2025)。根据列(3)至列(6)回归结果,与大语言模型互补性较高的职业薪资有更大幅度的增长,同时对工作经验的要求也相应提高。两类职业的招聘学历要求均显著提高,且二者之间的差异不显著,说明大语言模型对岗位学历要求的影响具有一定的普遍性,这表明企业在技术环境变化的情况下,可能将学历作为招聘的筛选工具。

表 3 细分替代和互补类型的回归结果
(1) (2) (3) (4)
替代 互补 替代 互补
$ Recruit\_ share $ $ Recruit\_ share $ $ Recruit\_ wage $ $ Recruit\_ wage $
$ LLM\_ exposure\times Post $ −0.013 0.160** 0.132** 0.279***
(0.026) (0.072) (0.055) (0.059)
职业细类固定效应 控制 控制 控制 控制
年份—季度固定效应 控制 控制 控制 控制
观测值 3270 3429 3270 3429
R2 0.902 0.936 0.615 0.605
经验 p 0 0.038
(5) (6) (7) (8)
替代 互补 替代 互补
$ Edu $ $ Edu $ $ Experience $ $ Experience $
$ LLM\_ exposure\times Post $ 1.662*** 1.458*** 0.281 0.756***
(0.641) (0.553) (0.258) (0.261)
职业细类固定效应 控制 控制 控制 控制
年份—季度固定效应 控制 控制 控制 控制
观测值 3270 3429 3270 3429
R2 0.573 0.536 0.396 0.441
经验 p 0.331 0.085
  注:******分别表示在10%、5%和1%的显著性水平上显著;括号内是聚类到职业细类的稳健标准误;经验 p 值用于检验组间交互项系数差异的显著性,采用 Fisher 检验通过自抽样1000 次得到。

(二)稳健性检验 5

本文进行了一系列的稳健性检验,具体包括:一是动态效应估计;二是控制职业特征的时间趋势;三是排除重大事件政策调整、数字技术工程师培育项目等影响;四是更改解释变量及被解释变量的测度方式;五是验证大语言模型暴露度与职业实际人工智能技术使用的相关性;六是控制同一职业在不同行业中受大语言模型影响程度的异质性;七是工具变量检验;八是改变模型设定及限制样本;九是安慰剂检验。这些检验结果表明本文基准回归结果具有稳健性。

五、机制分析

本文将基于学习结果分类理论、大五人格理论与任务特征分析框架,探究大语言模型如何重塑劳动力市场的技能及任务需求结构。

(一)技能需求变化

对于认知技能,学习结果分类理论将其细分为三个维度:言语信息技能、智慧技能和认知策略。具体而言,言语信息技能衡量的是准确描述概念与事实的能力,智慧技能为运用概念去解决具体问题的能力,认知策略则是指通过调整认知过程来提升学习效率的能力(Gagné,1985)。对于非认知技能,现有文献多采用目前被广泛接受的大五人格模型对其进行测度,包括外倾性、情绪稳定性、开放性、随和性和尽责性5个维度(赵楠等,2025)。

本文参考曲英姿和范莎(2025)的做法,通过词频统计的方法, 2在年份—季度层面测度了各职业对不同技能的平均需求强度。本文将被解释变量替换为技能需求强度指标,按公式(1)进行回归,探究大语言模型出现前后工作技能的需求变化。由表4可知,大语言模型增加了认知技能的总需求强度,并主要增加认知技能中智慧技能的需求。这可能是因为大语言模型拓宽了认知技能的边界,降低了低阶认知技能的相对重要程度,劳动者需要更多的抽象概括和创造力等高阶认知能力来整合多领域知识,以利用模型输出的有效性,从而实现技术与人的深度互补。

表 4 认知技能需求变化
(1) (2) (3) (4)
认知技能 言语信息 智慧技能 认知策略
$ LLM\_ exposure\times Post $ 1.146* 0.093 0.973*** 0.080
(0.601) (0.302) (0.28) (0.176)
职业细类固定效应 控制 控制 控制 控制
年份—季度固定效应 控制 控制 控制 控制
观测值 6752 6752 6752 6752
R2 0.657 0.627 0.648 0.543
  注:******分别表示在10%、5%和1%的显著性水平上显著;括号内是聚类到职业细类的稳健标准误;观测值和基准回归不同是因为基准回归剔除了招聘占比、薪资、学历等缺失的观测值,而在对技能进行分析时无需用到上述信息。

表5结果显示,大语言模型对不同维度非认知能力的需求产生了差异性影响,减少了对大五人格中外倾性和情绪稳定性的需求,但是增加了对随和性的需求。这是因为:大语言模型实现了自动化社交,降低了面对面社交的不可替代性;其能批量且快速地处理重复性和冗杂性的任务,使得工作节奏更加可控,有助于减少工作产生的焦虑和烦躁,因此对外倾性和情绪稳定性要求降低。然而在模型替代了标准化任务后,“人性化服务” 可能逐渐成为工作的核心价值载体。在许多需要高情感投入的职业中,技术的自动化处理使得客户对人类情感支持和个性化服务的需求更为强烈。同时,企业在筛选这类岗位的劳动者时,会更聚焦于尊重、关心他人这类与核心价值直接匹配的特质,最终提高了对随和性的需求。

表 5 非认知技能需求变化
(1) (2) (3) (4) (5) (6)
非认知技能 外倾性 情绪稳定性 开放性 随和性 尽责性
$ LLM\_ exposure\times Post $ −0.691 −0.507** −0.070* 0.068 0.108** −0.290
(0.449) (0.222) (0.037) (0.075) (0.042) (0.246)
职业细类固定效应 控制 控制 控制 控制 控制 控制
年份—季度固定效应 控制 控制 控制 控制 控制 控制
观测值 6752 6752 6752 6752 6752 6752
R2 0.625 0.623 0.483 0.456 0.407 0.541
  注:******分别表示在10%、5%和1%的显著性水平上显著;括号内是聚类到职业细类的稳健标准误;观测值和基准回归不同是因为基准回归剔除了招聘占比、薪资、学历等缺失的观测值,而在对技能进行分析时无需用到上述信息。

本文检验了需求显著变化的各技能与招聘薪资、学历及工作经验的相关性。鉴于本文理论分析中指出,大语言模型改变招聘条件的背后逻辑在于:大语言模型提高了工作技能要求和任务的复杂度,改变了招聘市场中的筛选信号,当企业意识到劳动力需要具备更高技能来与大语言模型协作时,则会提高招聘的学历及经验门槛,并通过更高的薪资来进行补偿。而这“信号”恰恰是相关性的体现。根据统计性歧视理论,当雇主面对不完全信息时,会依据可观察群体属性来预测生产力,并制定招聘标准(Phelps,1972)。

表6所示,除情绪稳定性以外,其他技能与招聘薪资、学历和经验均显著正相关,说明这些技能属于劳动力市场中与高薪挂钩的正向筛选信号,情绪稳定性与三者的相关性均不显著,信号功能相对微弱。同时,大语言模型降低了招聘岗位对外倾性的需求,揭示了技能需求变化与技能作为筛选信号之间的差异:外倾性在传统劳动力市场中往往与管理、销售、协调等高回报岗位相关,因此与薪资和学历有正相关关系(李根丽和尤亮,2022)。然而,大语言模型的引入在一定程度上替代了部分对外部沟通、信息传递和标准化互动的需求。这表明技术冲击改变的是企业对技能的需求方向,而技能本身长期积累的市场信号价值并不会立即同步调整,二者之间的错位构成了劳动力市场调整的来源。

表 6 工作技能与招聘薪资、学历及经验的相关性
(1) (2) (3) (4) (5)
言语信息 智慧技能 外倾性 情绪稳定性 随和性
$ Recruit\_ wage $ 0.4048*** 0.4603*** 0.2056*** −0.0102 0.2002***
Edu 0.3515*** 0.3203*** 0.2453*** 0.0019 0.1577***
Experience 0.2821*** 0.2986*** 0.2020*** 0.0145 0.1258***
  注:******分别表示在10%、5%和1%的显著性水平上显著。

综上所述,尽管外倾性的需求降低可能会削弱部分大语言模型的影响,但大语言模型仍然通过增加智慧技能和随和性的需求显著提高了对薪资、学历和工作经验的要求。

(二)任务需求变化

鉴于工作任务在实证研究中难以量化,现有文献通常直接采用职业替代或根据执行任务所需的技能重新对职业进行分类(陈琳等,2024)。本文沿用上述做法,通过对职业进行分组回归的方式来探究大语言模型对不同任务需求的影响。

根据Acemoglu和Autor(2011)的研究,本文采用O*NET 数据测度了常规技能、非常规认知技能和非常规非认知技能对不同职业的重要程度,并按重要性的中位数进行分组,将高于中位数的组别视为主要执行该技能对应任务的职业。参考曲英姿和范莎(2025)的研究,本文将任务类型按职业大类同样分为三类,假定单位负责人和专业技术人员主要从事非常规认知任务,办事人员、生产制造人员、农林牧渔生产人员、辅助人员等主要从事常规任务,而商业和服务业人员主要从事非常规非认知任务。本文在公式(1)的基础上按上述分组对招聘占比进行回归。表7展示了分组回归的结果,可以看到大语言模型主要增加了对非常规认知任务的需求,这和前文分析一致。

表 7 工作任务需求变化
按O*NET 指标分类
(1) (2) (3)
变量 常规任务 非常规认知任务 非常规非认知任务
$ LLM\_ exposure\times Post $ 0.049 0.260*** 0.008
(0.030) (0.083) (0.048)
职业细类固定效应 控制 控制 控制
年份$ - $季度固定效应 控制 控制 控制
观测值 3320 3421 3374
R2 0.947 0.940 0.929
按职业大类分类
(1) (2) (3)
变量 常规任务 非常规认知任务 非常规非认知任务
$ LLM\_ exposure\times Post $ −0.032 0.171*** 0.110
(0.036) (0.064) (0.098)
职业细类固定效应 控制 控制 控制
年份—季度固定效应 控制 控制 控制
观测值 1960 2822 1917
R2 0.870 0.936 0.932
  注:******分别表示在10%、5%和1%的显著性水平上显著;括号内是聚类到职业细类的稳健标准误。

本文检验了不同测度方式下的非常规认知任务与招聘薪资、学历以及工作经验的相关性。如表8所示,不管采用何种测度方式,职业的非常规认知任务都与招聘薪资、学历和工作经验显著正相关,表明大语言模型通过提升岗位对非常规认知任务的需求强度提高了招聘薪资水平及用工门槛。

表 8 工作任务与招聘薪资、学历及经验的相关性
(1) (2)
非常规认知任务
(按O*NET 指标分类)
非常规认知任务
(按职业大类分类)
$ Recruit\_ wage $ 0.3123*** 0.2997***
Edu 0.3307*** 0.3103***
Experience 0.1937 *** 0.1952***
  注:******分别表示在10%、5%和1%的显著性水平上显著。

六、异质性分析

本文进一步从公司规模和盈利能力等方面进行异质性分析,观察不同特征公司的招聘需求受大语言模型影响的差异性,并在公司—职业—季度层面构建了如下模型:

$ \begin{array}{c} {Y}_{ijqt}={\beta }_{0}+{\beta }_{1}{LLM\_ exposure}_{i}\times {Post}_{qt}+{\mu }_{i}+{\lambda }_{qt}+{\eta }_{jt}+{\varepsilon }_{iqt} \end{array} $ (2)

其中,下标$ i $$ j $$ q $$ t $分别代表职业细类、公司、季度和年份;$ {Y}_{ijqt} $$ t $$ q $季度$ j $公司第$ i $个职业的招聘数量占该公司相同时间段招聘总数的比例,以及$ t $$ q $季度$ j $公司对第$ i $个职业细类招聘的平均薪资、学历要求和工作经验要求;$ {LLM\_ exposure}_{i} $$ {Post}_{qt} $$ {\mu }_{i} $$ {\lambda }_{qt} $的定义和公式(1)相同;$ {\eta }_{jt} $为公司—年份固定效应;$ {\varepsilon }_{iqt} $为随机扰动项;$ {\beta }_{1} $衡量了在大语言模型冲击下,职业大语言模型暴露度对公司招聘需求的边际影响。

本文按照模型(2)的设定,采用未分组的全部公司样本进行回归。结果如表9所示,在中文大语言模型发布后,公司对招聘岗位的薪资、学历及工作经验要求都有所提升,和与在职业—季度层面进行的基准回归结论基本一致。接下来,本文从公司规模与盈利能力等维度展开异质性分析。本文以国泰安数据库(CSMAR)中上市公司的对数总资产、总资产收益率(净利润/总资产)、现金流状况(经营现金流净额/总资产)为指标,按指标是否高于公司所属行业的当年中位数,将样本划分为不同规模、收益率、现金流的组,再通过统一社会信用代码进行匹配,最终确定各公司的分组结果。

表 9 公司—职业—季度全样本回归结果
(1) (2) (3) (4)
$ Recruit\_ share $ $ Recruit\_ wage $ $ Edu $ $ Experience $
$ LLM\_ exposure\times Post $ 0.029 0.173*** 0.501*** 0.446***
(0.022) (0.021) (0.105) (0.091)
职业细类固定效应 控制 控制 控制 控制
年份—季度固定效应 控制 控制 控制 控制
公司—年份固定效应 控制 控制 控制 控制
观测值 220254 220254 220254 220254
R2 0.636 0.420 0.273 0.230
  注:******分别表示在10%、5%和1%的显著性水平上显著;括号内是聚类到职业细类的稳健标准误。

本文分别按公司规模、总资产收益率和现金流状况进行分组并重新回归。 4表10可知,不论是资源禀赋相对充足还是匮乏的公司,在大语言模型发布后均显著提升了招聘薪资以及学历和工作经验要求,说明大语言模型的影响具有一定的普适性。此外,对比不同特征公司核心解释变量的系数估计值及组间差异检验的p值可以得出:在大语言模型发布后,大规模公司招聘薪资和工作经验要求的平均上涨幅度都要高于小规模公司。根据回归结果,较高收益率公司的工作经验要求以及较高现金流公司的招聘学历要求都比较低收益率和较低现金流公司提升更多,说明资源禀赋充足的公司凭借更强的资金实力,能够更快地优化招聘条件,而资源匮乏的公司往往面临成本压力,对招聘条件的调整相对滞后。这可能会导致中小企业难以吸引人才,从而在大语言模型的技术应用中处于劣势。企业的两极分化不仅会使得大语言模型作为“通用目的技术”的潜力无法充分释放,还可能导致行业集中度上升和市场竞争力下降。

表 10 公司规模异质性分析
大规模 小规模 大规模 小规模
(1) (2) (3) (4)
$ Recruit\_ share $ $ Recruit\_ share $ $ Recruit\_ wage $ $ Recruit\_ wage $
$ LLM\_ exposure\times Post $ 0.030 0.028 0.190*** 0.107***
(0.023) (0.024) (0.024) (0.023)
职业细类固定效应 控制 控制 控制 控制
年份—季度固定效应 控制 控制 控制 控制
公司—年份固定效应 控制 控制 控制 控制
观测值 163692 51131 163692 51131
R2 0.612 0.625 0.413 0.449
经验p 0.342 0
大规模 小规模 大规模 小规模
(5) (6) (7) (8)
$ Edu $ $ Edu $ $ Experience $ $ Experience $
$ LLM\_ exposure\times Post $ 0.527*** 0.365** 0.506*** 0.317***
(0.119) (0.175) (0.112) (0.099)
职业细类固定效应 控制 控制 控制 控制
年份—季度固定效应 控制 控制 控制 控制
公司—年份固定效应 控制 控制 控制 控制
观测值 163692 51131 163692 51131
R2 0.268 0.308 0.220 0.268
经验p 0.221 0.085
  注:******分别表示在10%、5%和1%的显著性水平上显著;括号内是聚类到职业细类的稳健标准误。经验 p 值用于检验组间交互项系数差异的显著性,采用 Fisher 检验通过自抽样1000 次得到。

七、结论、建议与不足

本文利用2022年 1 月至2024 年 3 月在线招聘数据,综合采用BERT 模型及连续双重差分模型探究了大语言模型对我国劳动力市场不同维度招聘需求的影响。研究发现,在中短期内大语言模型对我国上市公司总体招聘数量无明显影响,但却改变了不同类型职业的相对需求,显著增加了互补型职业的招聘占比,这可能会增加不同职业间的就业差距。此外,大语言模型还显著提高了在线招聘岗位的平均薪资、受教育年限及工作年限要求。具体而言,在大语言模型发布后,职业暴露度每提高一个标准差,招聘月薪平均增加约 330元,受教育年限要求平均增加约 0.3 年,工作经验要求平均增加约0.1 年。这意味着受大语言模型影响,低学历和较少工作经验的劳动力就业可能更加困难;高学历和工作经验丰富的劳动力则更有可能获得更高的薪资报酬,从而导致就业差距进一步扩大。

劳动力需求变化的本质是劳动力市场对工作技能和工作任务需求的改变。基于经典的学习结果分类理论和大五人格理论,本文探究了大语言模型对不同维度认知技能和非认知技能需求的影响。本文研究发现,大语言模型增加了认知技能中智慧技能的需求和非认知技能中随和性的需求,减少了非认知技能中外倾性和情绪稳定性的需求。对任务需求的研究表明,大语言模型增加了对非常规认知任务的需求。技能和任务需求的变化共同解释了劳动力需求变化的内在逻辑。随着技能和任务组合向更高难度、更复杂的方向发展,当企业难以直接观测劳动力与大语言模型的协同能力时,企业将学历和工作经验作为低成本筛选信号,形成“技术进步—门槛抬升—弱势排斥” 的传导机制。低学历、较低技能的劳动者不仅面临的就业机会减少,还因就业困难而无法积累工作经验。这一发现突出了技术变革对社会公平的潜在冲击,也为理解新时代劳动力市场分化提供了微观基础。本文针对企业资源禀赋的异质性分析发现,尽管规模、总资产收益率和现金流状况不同的企业在大语言模型发布后均提升了招聘薪资及学历和工作经验要求,但资源充足企业的招聘条件调整幅度更大,这可能会使大型企业形成人才集聚效应,进一步拉大企业间发展差距,不利于劳动力市场均衡发展。

根据结论,本文提出如下政策建议:

第一,针对技术变革带来的技能需求结构变化,实施面向人工智能时代的技能培训计划。本文研究发现,大语言模型显著提升了劳动力市场对智慧技能和随和性的需求。因此,技能培训应重点围绕与人工智能形成互补关系的能力展开。具体而言,应重点加强数据处理能力、信息检索能力、复杂问题解决能力以及人机协作能力等数字认知技能培训,通过职业培训机构与企业合作开设课程,提高劳动者利用人工智能工具提升工作效率的能力。同时,还应强化以尊重他人、关心他人为核心的随和性技能培养。在职业培训中可通过情境模拟、小组协作任务和案例讨论等方式,提升劳动者在团队协作中的沟通表达能力、冲突协调能力以及跨部门合作能力,使其能够在协同工作的环境中发挥作用。

第二,完善面向技术冲击群体的就业保障与再就业支持机制。本文的研究结果显示,大语言模型显著提高了招聘岗位的学历和经验要求,可能使低学历和较少工作经验的劳动者更难就业,从而面临技术性失业的风险。因此,就业保障政策应重点关注在技术变革中受到冲击的劳动者群体,尤其是从事重复性信息处理工作、岗位需求明显下降的劳动者。首先,可依托公共就业服务体系建立人工智能冲击职业监测机制,通过持续跟踪招聘需求变化及时识别替代风险较高的职业,并提前开展有针对性的职业培训;其次,应进一步落实再就业支持政策,降低劳动者在职业转换过程中的经济成本;最后,在招聘制度层面,应推动企业逐步建立以能力为导向的招聘机制,减少对学历信号的过度依赖,并且通过技能测试、项目经历评估等方式识别劳动者的实际能力,逐步完善权威的技能认证体系,为低学历但具备一定技能的劳动者提供更加公平的就业机会。

第三,培养适应人工智能时代的人才。随着大语言模型的发展,劳动力市场对高技能和复合型人才的需求不断上升,教育体系有必要在更早阶段调整人才培养结构。在基础教育阶段,应逐步将数字素养、人工智能基础知识以及数据思维纳入课程体系,提升学生对数字技术的理解与应用能力。在职业教育和高等教育阶段,则应增加与人工智能和数字化转型相关的课程内容,推动复合型专业建设。同时,应鼓励高校与企业开展更加紧密的合作,通过企业实践项目等方式使教学内容更加符合企业的真实需求。

第四,实施差异化企业支持政策,缓解技术应用带来的企业之间差异化问题。本文研究发现,资源禀赋高的企业在大语言模型发布后,其招聘条件提高幅度更加明显,这意味着技术应用可能加剧了不同企业之间的人力资本需求差距。因此,应通过差异化政策降低中小企业应用人工智能技术的门槛。一方面,可以通过技术应用补贴、人工智能咨询服务和共享算力平台等方式,帮助中小企业使用大语言模型技术,减少其技术应用和人才招聘的成本;另一方面,应鼓励大型企业通过技术输出、产业联盟或联合培训等方式,与中小企业共享技术资源与人才培养体系,从而推动不同规模企业在人工智能时代实现协同发展。

当然,本文也存在一定的不足。首先,在样本覆盖范围上,本文只包含了规模较大的上市公司,可能无法代表整个劳动力市场的需求变动;其次,在样本时间跨度上,本文分析范围仅限于中文大语言模型发布前后一年,因此评估的是大语言模型对劳动力市场的短期效应,长期影响还有待进一步研究;最后,本文针对中文职业暴露度的测度是通过中美职业名称匹配得到的,而中美同一名称职业的工作任务也可能存在一定差异,未来可考虑通过更直接的方法对中国职业的大语言模型暴露度进行测算。

1$ 8778\times ({e}^{0.181\times 0.204}-1)\approx 330 $$ 1.452\times 0.204\approx 0.3 $$ 0.473\times 0.204\approx 0.1 $

2限于篇幅,省略技能词典,留存备索。

3详见附表26。

4限于篇幅,省略部分表格回归结果,留存备索。

5限于篇幅,省略图表分析结果,留存备索。

主要参考文献
[1] 陈琳, 高悦蓬, 余林徽. 人工智能如何改变企业对劳动力的需求?——来自招聘平台大数据的分析[J]. 管理世界, 2024(6): 74–93.
[2] 陈澍, 韩清, 张伯超. 企业人工智能技术水平与劳动力需求结构变化: 基于大语言模型的新方法和新发现[J]. 技术经济, 2025(1): 1–13.
[3] 蒋为, 陈星达, 倪诗程. 人工智能、产业结构转型与跨越“中等收入陷阱”[J]. 经济研究, 2025(10): 239–260. DOI:10.3969/j.issn.0577-9154.2025.10.013
[4] 李根丽, 尤亮. 非认知能力对非正规就业者工资收入的影响[J]. 财经研究, 2022(3): 124–138. DOI:10.16538/j.cnki.jfe.20211218.303
[5] 李志, 骆行. 智能革命下的人力重构: DeepSeek、Manus类生成式人工智能对人力资源市场的挑战、影响及治理研究[J]. 重庆大学学报(社会科学版), 2025(3): 105–117.
[6] 曲英姿, 范莎. 机器人兴起与中国劳动力市场技能需求结构——来自中国招聘网站的证据[J]. 华东师范大学学报(教育科学版), 2025(4): 70–103. DOI:10.16382/j.cnki.1000-5560.2025.04.007
[7] 谭莹, 刘颖杰, 张勋. 企业数字化转型程度的统计测度: 以数字技术人才需求为视角[J]. 经济研究, 2025(4): 122–138.
[8] 张丹丹, 于航, 李力行, 等. 中国人工智能技术暴露度的测算及其对劳动需求的影响——基于大语言模型的新证据[J]. 管理世界, 2025(7): 59–72. DOI:10.3969/j.issn.1002-5502.2025.07.006
[9] 张叶青, 陆瑶, 李乐芸. 大数据应用对中国企业市场价值的影响——来自中国上市公司年报文本分析的证据[J]. 经济研究, 2021(12): 42–59.
[10] 赵楠, 廖婉晴, 张子哲. 早期留守经历、人力资本积累与初育年龄推迟[J]. 统计研究, 2025(8): 108–121.
[11] Acemoglu D, Autor D. Skills, tasks and technologies: Implications for employment and earnings[A]. Card D, Ashenfelter O. Handbook of labor economics[M]. Amsterdam: Elsevier, 2011: 1043-1171.
[12] Alekseeva L, Azar J, Giné M, et al. The demand for AI skills in the labor market[J]. Labour Economics, 2021, 71: 102002. DOI:10.1016/j.labeco.2021.102002
[13] Autor D H, Dorn D. The growth of low-skill service jobs and the polarization of the US labor market[J]. American Economic Review, 2013, 103(5): 1553–1597. DOI:10.1257/aer.103.5.1553
[14] Brown T B, Mann B, Ryder N, et al. Language models are few-shot learners[A]. Proceedings of the 34th International Conference on Neural Information Processing Systems[C]. Vancouver: Curran Associates Inc. , 2020.
[15] Brynjolfsson E, Li D, Raymond L R. Generative AI at work[J]. The Quarterly Journal of Economics, 2025, 140(2): 889–942. DOI:10.1093/qje/qjae044
[16] Chen Q, Ge J F, Xie H Q, et al. Large language models at work in China’s labor market[J]. China Economic Review, 2025, 92: 102413. DOI:10.1016/j.chieco.2025.102413
[17] Demirci O, Hannane J, Zhu X R. Who is AI replacing? The impact of generative AI on online freelancing platforms[J]. Management Science, 2025, 71(10): 8097–8108. DOI:10.1287/mnsc.2024.05420
[18] Devlin J, Chang M W, Lee K, et al. BERT: Pre-training of deep bidirectional transformers for language understanding[A]. Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies[C]. Minneapolis, Minnesota: ACL, 2019.
[19] Eloundou T, Manning S, Mishkin P, et al. GPTs are GPTs: Labor market impact potential of LLMs[J]. Science, 2024, 384(6702): 1306–1308. DOI:10.1126/science.adj0998
[20] Epstein Z, Hertzmann A, The Investigators of Human Creativity. Art and the science of generative AI[J]. Science, 2023, 380(6650): 1110–1111. DOI:10.1126/science.adh4451
[21] Gagné R M. The conditions of learning and theory of instruction[M]. New York: Holt, Rinehart and Winston, 1985.
[22] Graetz G, Michaels G. Robots at work[J]. The Review of Economics and Statistics, 2018, 100(5): 753–768. DOI:10.1162/rest_a_00754
[23] Hering A, Rojas A. AI at work report 2025: How GenAI is rewiring the DNA of jobs[R]. Indeed Hiring Lab, 2025.
[24] Jiang W, Park J, Xiao R, et al. AI and the extended workday: Productivity, contracting efficiency, and distribution of rents[R]. National Bureau of Economic Research No. w33536, 2025.
[25] Phelps E S. The statistical theory of racism and sexism[J]. The American Economic Review, 1972, 62(4): 659–661.

1$ 8778\times ({e}^{0.181\times 0.204}-1)\approx 330 $$ 1.452\times 0.204\approx 0.3 $$ 0.473\times 0.204\approx 0.1 $

2限于篇幅,省略技能词典,留存备索。

3详见附表26。

4限于篇幅,省略部分表格回归结果,留存备索。

5限于篇幅,省略图表分析结果,留存备索。

NLAUSw237cgY