当前位置: 首页 > 智库建言

陈云松:让数据算法成为调查研究的重要手段

时间:2023-07-04 来源:中国社会科学报 作者:陈云松

“调查研究是谋事之基、成事之道。”党的十八大以来,以习近平同志为核心的党中央高度重视调查研究,倡导全党大兴调查研究之风。中共中央办公厅印发了《关于在全党大兴调查研究的工作方案》,对新时代、新阶段、新征程调查研究的重点内容、方法步骤提出了明确要求。方案指出,大兴调查研究、开展调研“要坚持因地制宜,综合运用座谈访谈、随机走访、问卷调查、专家调查、抽样调查、统计分析等方式,充分运用互联网、大数据等现代信息技术开展调查研究,提高科学性和实效性”。伴随数字化转型浪潮的到来,数据算法研究正成为大兴调查研究不可或缺的工具手段。这一研究范式通过发挥互联网海量数据的作用,提高了发现社会问题的能力,提升了研究结论的适用性,增强了研究服务党和国家工作大局的能力。

  用好数据是我们党调查研究的传统

  调查研究是我们党的传家宝,重视调查研究是我们党的优良传统。回溯历史,调查研究一直贯穿于党的具体工作之中,并发挥了至关重要的作用。正是一次又一次深入基层、深入群众的调研实践,使得发现问题、妥善解决、汲取经验、总结规律的过程形成环环相扣的链条,为新的理论阐发提供源源不断的生命力。其中,数据资料发挥了重要作用。

  调查研究是毛泽东同志一生所倡导的科学工作方法,也是他一生所极力推崇的思想方法。在大革命时期,毛泽东同志历时32天,行程700多公里,对湖南五县农民运动进行详细考察之后,撰写了《湖南农民运动考察报告》一文。正是对农民运动内容和形势数据资料的高度重视和准确把握,才使这篇文章成为无产阶级政党领导农民革命斗争的纲领性文献。

  习近平总书记是运用调查研究身体力行的实干家。在正定、宁德、福州、浙江任职期间,他都亲临一线和基层,跑遍整个工作辖区,在一次次深入细致的调研工作中更准确地认识和把握各领域的优势和劣势、经验和问题。党的十八大以来,习近平总书记考察调研的脚步遍布祖国大江南北。他多次强调调查研究的重要意义,指出“调查研究是谋事之基、成事之道”,“调查研究不仅是一种工作方法,而且是关系党和人民事业得失成败的大问题”。

  习近平总书记十分重视调查研究方法的与时俱进。2005年,时任浙江省委书记的习近平同志在调研时指出,“加强调查研究工作,必须积极探索新时期调查研究工作的特点和规律”,并明确强调重视数据的作用,“我们还必须适应经济社会发展变化的新情况,善于运用科学的调查方法,综合运用经济学、社会学、信息论、系统论、控制论等多学科理论,为正确决策提供全面、翔实、可靠的信息和数据”。

  科学调查研究需要准确反映社情、把握民意,体现人民的利益和意愿,只有这样,才能真正从人民群众的角度出发,解决实际问题。在此过程中,作为指导决策、提高工作效率的重要工具,数据的收集、分析和应用发挥了至关重要的作用。合理地使用数据、分析数据,能够帮助我们更加准确地洞悉时代发展的新变化、适应新形势,让各项方针政策更好地惠及人民,推动各项理论和实践工作取得更好成效。

  新时代数据为调查研究提供前所未有的机遇

  近年来,随着信息技术的飞速发展,数据集的规模已经超越传统软件和个人计算机的存储和分析极限,为新时代的调查研究提供了前所未有的机遇。具体来说,这些“大数据”基于数亿人在互联网中的社会行为、社会互动,也即庞大的“数字足迹”而形成,具有规模迅速扩大、来源愈发多样、价值不容小觑等特征。在互联网和新型大数据的助力下,我们可以大大节约调查所需的时间成本,在力所能及的范围之内得出基于总体的宏观结论,发现隐蔽的社会现象和现象之下暗含的社会意识。

  当然,这里所谓的新时代“数据”并不只是单纯的数字,而是囊括了大规模文本、新闻媒体报道、图像、影视资料的数字化档案。这些记录了人类社会文化变迁的珍贵资料,能够帮助研究者最大程度地跨越时空维度限制,不仅关注当下,更探索远距离空间和历史长河中的社会话语与文化实践,从而“以史为镜”,为当下社会现象的分析、社会问题的解决提供历史经验,也为中华民族伟大复兴的新征程指明道路与方向。

  与新型数据相对应的,是迅速更新的计算分析方法,例如复杂数据可视化、仿真模拟、机器学习算法,等等。对于海量规模的数据,传统的统计计量方法算力无法完全覆盖,需要人工智能方法的加入,以实现对数据中隐藏信息的深度挖掘。比如以机器学习技术进行大规模文本分析,对具有隐匿性的重要指标进行预测,用仿真模型推演可能的政策结果,等等。而宏观大数据与微观调查数据的结合,能够在一定程度上解决“生态谬误”的问题,避免宏观与微观研究路径的混淆,从而加深我们对调查分析中因果关系的理解。

  需要注意的是,互联网海量数据和前沿的计算分析方法能够深化调查研究,但并不意味着我们只需要模式化地抓取、分析数据,从而让调查研究成为脱离实际的“数字游戏”。正如习近平总书记所指出的那样,“我们要根据调查任务和要求的不同,采用不同的调查方法,把微观调查和宏观调查结合起来,把定性分析和定量分析结起来,大胆创新,多管齐下,提高调研工作的效率和调研成果的质量”。因此,我们也需要将宏观、微观的数据分析与实地考察相结合,使得调查分析的结果更好地增进民生福祉。

  探索社会学定量研究助力大兴调查研究之风的路径

  对于服务现代化建设的社会调查研究来说,需要能够阐发明确解决方案的模式,以更可靠、科学的方式将数据、方法和理论相互联结。因此,我们需要谨慎选择经验研究工具、精心设计研究思路,以获得更为深入、准确的结论。

  首先是质性调研结论、传统调查数据、宏观海量大数据的结合。质性调研实地探索社会现象及问题,而政策落地之后的定期回访,也在一定程度上保证了实施效果;传统调查数据根据实践需要设计具有群体针对性的问卷,主要获取微观个体的行为和态度;大数据分析充分利用信息时代的多样化数据来源,更为科学地透视历史与当代社会。三种数据的有机结合,充分践行了“交响乐式”多角度、组合式的研究范式,能够为澄清社会事实、呈现复杂现象、提供治理意见带来重大突破。

  其次是传统定量方法与计算方法的结合。传统定量社会学分析以统计回归分析为主,探讨变量间的相关或因果关系。而人工智能等计算方法的加入,既能够对异质性因果效应进行分析,建构复杂非线性关系和多变量交互作用的模式,也将“证伪检验”拓展至基于机器学习的“计算扎根”方法。“计算扎根”是对从理论出发的传统回归的颠覆,通过对模型变量进行预测建模,能够从数据出发生成社会理论。这对基于大数据的调查研究来说,可能冲破常规理论和既有现象的束缚,开辟全新的分析思路,建构与现有现代化进程理论相异的独特“中国方案”。

  我们应该认识到,调查研究并不是简单的数据处理,还需要多种方法的组合,以进行理性的推演、综合的分析。而这样的分析也不再仅仅是简单的“数字化”研究,而是在调查过程中实现人工智能技术的发展,将科技与实际相结合,让科技强国引领下的“数智化”的方法成为新时代调查研究的新方向。

  随着新时代数据存储和分析技术的不断演进,数据算法在调查研究中的充分运用已经不再遥远。通过数据算法,我们能够更加准确、深入地掌握社会变化的趋势,发现、分析并解决存在的社会问题,为政策的制定、实施与改进提供理论和实证的支持。相信在党的坚强领导下,我们能够利用好数据算法这一重要工具,在调查和实践中求索真知灼见,为中国式现代化觅得木本水源。

  (作者系南京大学党委副书记)

(编辑:管理员003)