1 引言
作为中国特色新型智库的重要组成部分,部分中央企业智库(央企智库)已经发展成为服务党和国家重大战略、支撑引领行业产业发展、推动企业科学决策的重要力量。面对数字经济新形势,以及国家和企业要求更高的服务决策能力水平,中央企业智库亟需提升数智化能力,完善运营机制,助力企业前沿思想、成果的聚合以及内外优质研究资源的连接与合作,支撑企业战略决策,在企业“把方向、管大局”上贡献智慧。
2 央企智库数智化能力现状及建设的意义和目标
2.1 央企智库的定位及数智化能力建设的必要性
2023年5月26日,国务院国资委印发了《关于中央企业新型智库建设的意见》,文中将中央企业新型智库定位为以战略问题和创新发展为主要研究对象,以服务党和政府及国资国企改革发展、行业产业、中央企业科学决策为宗旨的研究咨询机构。这一定位要求央企智库需要具备对宏观大局的洞察和研判能力、对产业趋势和科技创新方向的把握能力、对重大问题的分析和诊断能力,进而能够为治国理政、产业转型升级、建设世界一流企业建言献策。因此,央企智库既是企业的智囊,也是国家和行业的参谋,科学有效的决策支撑是央企智库能力建设的核心要点。
当前,无论是国家层面,还是企业层面,跨界、跨专业的问题越来越多,仅靠单一企业的知识体系、单一领域的专家,已无法实现科学诊断和决策,央企智库需要充分发挥多元信息和数据的整合、跨领域知识和思想的集成作用。利用云计算、大数据、类ChatGPT大模型技术等数智化技术,赋能央企智库,既有助于智库形成常态化的情报搜集和跟踪机制,构建完善支撑科学决策的结构化、数字化、全球化的行业产业数据库、知识库、政策库等,实现数智化成果展示,提高决策效率,又有助于智库聚合跨领域专家资源,提升合作创新与决策支撑能力,促进更大范围的知识共享和流通,进而产出更高质量、更具可行性的研究成果。数智化能力是数智化时代中央企业建设新型智库,实现高效、可持续运营的有力保障。
2.2 央企智库数智化能力现状及存在问题
综合对某通信运营商研究院、某电网研究院、某集团战略研究院等多家中央企业智库进行调研,以及大量案头资料跟踪研究的情况看,目前大部分中央企业智库的数智化水平还处于初级阶段。具体来说,主要存在以下问题:一是缺少统一的整合智库内外部数据的管理平台,内部数据、资料、成果等分散在多个业务系统中(如办公自动化、项目管理、情报系统等),外部资料和数据尚未建立持续的收集与分享机制,导致研究人员无法实现知识资源的集中获取和使用;二是缺少对内外部专家资源的统一和标签化管理,难以实现领域专家的快速识别和调度;三是缺少协同研究支撑平台,团队内部协作、内外部专家合作沟通等主要通过微信等通信工具实现,难以做到协作过程的有效管控和知识资源的实时沉淀;四是很多研究成果依然分散在个人及小团队计算机中,阻碍研究成果的统一展示、借鉴参考和创新利用。
2.3 央企智库数智化能力建设的内涵及目标
央企智库数智化建设是指借助新一代信息技术,构建面向决策支持和创新发展的统一研究支撑和思想生产平台,以“数字化平台+AI(人工智能)能力+知识服务”强化研究资源的聚合、沉淀、流转、协同、创造和再利用,驱动研究人员工作方式的变革和生产效率的提高,进而提升央企智库的服务能力和业界影响力。
央企智库数智化能力建设的总体目标是以用户为中心,聚焦核心业务场景和需求,聚合与连接优质研究资源,提升智库研究效率与开放协同水平。具体包括:建立行业资料库、数据库与成果库,引入智能聚合、生成式人工智能(artificial intelligence generated content,AIGC)等智能化技术,提高知识的整合、展示与服务水平;建立合作资源库与联合研究支持中心,连接内外部专家、知名智库、研究团体等,具备广泛的研究协同支持能力;制定资源统筹制度、平台治理制度,引入安全共享交流技术等,确保平台可持续运营,实现智库数据资源的高效管理及价值创新。
3 央企智库数智化能力平台的架构设计、功能规划与知识组织探索
根据央企智库数智化能力建设目标,央企智库数智化能力平台是指利用数字化技术提升信息和知识的自动化处理程度及可获得性,实现央企智库数据资源全面整合、知识创新协同,以及增强智库服务能力的数字化平台。天翼智库建设团队根据央企智库数智化能力建设目标,参考蓝凌软件公司、拓尔思信息技术股份有限公司等国内领先内容管理平台提供商的平台设计架构,研究总结出智库数智化能力支撑平台总体设计架构图(图1),并基于此架构对原有平台进行了升级。
3.1 央企智库数智化能力平台主要功能解析
3.1.1 基础层
基础层主要实现智库数智化能力建设的云上部署,以及互联网开源数据、自有数据资源(包含原有业务系统中的数据)、第三方合作数据等多来源、多形态数据资源的全面汇聚和整合。3.1.2 数据中台 数据中台是央企智库数智化能力建设的核心层,为知识价值链[3]的全流程管理提供技术支撑,主要由五大功能构成。
(1)数据采集:通过网络爬虫、数据接口等方式,与各类内部、外部数据源进行对接,实现对智库所需的各类数据的自动化、实时化、全面化的采集和接入。
(2)数据整合:通过对采集到的各类数据进行清洗、转换、标准化、融合化处理,确保数据资源的高质量和高可用性。
(3)数据管理:对加工后的各类数据进行分类、目录化、标签化、元数据化等管理,实现数据资源的规范化、可视化、可查询性的有序管理和维护,构建成果库、资料库、数据库、合作库、专家库五大基础资源库。
(4)数据服务:利用AI引擎(如语义、图像解析)、分析标注引擎(如智能标签、智能聚类)、算法模型(如知识推荐算法、关联模型)等实现知识资源的深度挖掘、关联发现、场景化聚合及创新生成,以此确保知识供给与研究需求和场景的高效、精准匹配,提高研究效率和质量。
(5)数据共享:通过数据服务总线对整合后的各类数据进行权限控制、安全保障、接口开放等处理,实现对央企智库所需数据资源的安全控制和灵活调用。
3.1.3 应用平台
应用平台指央企智库知识生产的协同创新和应用传播平台,主要包括知识仓库、协作中心、专家中心、知识问答及个人中心五大功能模块。
(1)知识仓库:基于数据中台,通过分类知识树、智能检索、知识地图、知识图谱等形式,将合适的知识内容传递给有需要的研究人员。
(2)协作中心:具有文档库、权限管理等功能,且支持成果审核发布等流程的数字化,是课题协同研究、政策研讨、跨域专家合作的支撑工具。
(3)专家中心:基于数据中台专家库的资源,提供内外部专家信息查询功能,实现专家在线交流、在线调研,以及更深层次的专家合作。
(4)知识问答:支持智库专家之间的交流和沟通,并对问答信息进行管理和评价,形成知识合集,同时,也可以基于知识原子化及AIGC技术提供智能机器人问答服务。
(5)个人空间:提供个人知识管理、个人收藏、个人圈子等多种个性化设置和内容呈现。
3.1.4 服务层
服务层通过个人计算机(personal computer,PC)门户、移动端门户及信息大屏等多媒体展现形式,面向不同角色(如决策人、研究员、管理员等)人员,对智库知识内容和研究成果进行差异化呈现。
3.2 央企智库数智化能力平台知识组织模式创新探索
在天翼智库数智化能力建设实践中,研究团队尝试采用知识地图的方式,来解决研究场景(课题)与知识资源的智能匹配问题,以提高研究效率和知识利用率,取得了较好的成效。
知识地图是一种常见的知识聚合模式,通过将业务流程、工作场景等分解为多个环节,按节点聚合具有相同标签属性的数据、文档、成果、专家等各类资源,建立不同组织方式、不同存储方式的研究资源之间的动态联系。知识地图输出的内容包括知识来源、整合后的知识内容、知识流和知识汇聚,以直观的方式向用户展示知识概况、主题类别、关联关系等,其作用是协助研究人员发掘智力资产的价值、所有权、位置和使用方法,支撑智库研究工作的高效开展。知识地图建模通常由领域专家联合专业研究团队共同完成,需求导向、主题突出、重点牵引、动态易扩、方便获取是知识地图构建的5个原则。知识地图种类较多,场景类知识地图是智库研究工作中最常用的地图形态,建模示例如图2所示。
3.3 央企智库数智化能力平台的风险判断
央企智库数智化能力平台能够有效解决央企智库目前面临的一些关键问题,例如,信息和知识资源分散存放、决策支持效率低、跨域专家合作难、缺少协同支撑工具、成果发布渠道单一等,因此,对中央企业建设新型智库具有非常重要的作用和价值,未来有可能成为央企智库核心竞争力的重要组成部分。但同时也要注意到,一旦启用数字化平台,就需要将智库的高端成果及核心经验知识上传到平台,并实现共享,这可能使企业知识资产存在对外泄露等安全风险。对此,智库管理团队需要制定严格的信息安全管理机制,评估各类数据和信息的保密级别,加强接入数字化平台的人员和设备的认证及权限管理,例如,智库数字化平台仅允许在公司内网访问,对系统内知识进行严格的分级管理和访问权限控制等。
4 引入类ChatGPT大模型技术赋能智库的场景及模式探索
类ChatGPT大模型技术的持续突破,为各行业提供了丰富的内容创新和价值提升的可能性。类ChatGPT大模型技术在智能问答、内容创作、信息抽取、数据分析等方面的能力与智库的研究和咨询工作有巨大的融合空间,将革新智库决策支持的方法和模式。
4.1 类ChatGPT大模型技术与智库融合的典型场景
引入类ChatGPT大模型技术所带来的智库创新场景主要体现在以下几个方面。
(1)知识获取。传统的知识获取方式是智库专家根据需求自上而下地获取知识。而通过智能知识挖掘,可以利用数据自下而上,从数据中挖掘知识、抽取知识,给专家更好的支持。目前智库本身有大量成果报告等高质量的用户生成内容(user generated content,UGC)及知识图谱,可为AI自动准确挖掘和生成知识提供高质量数据源。
(2)辅助研究。接入文本生成、图像生成、视频生成等AI能力,对知识内容进行自动或协同创作、优化、补充等操作,提高知识的质量和丰富度。另外,类GPT大模型技术插件的接入会大大缩短研究报告创作的时间。这主要体现在数据或者素材的提供方面,有了“GPT+联网”的能力,效率可以得到大幅提升。
(3)智能搜索。利用语义搜索、问答系统、推荐系统等AI技术,对用户的查询进行智能理解和匹配,提供精准、相关、个性化的知识结果。目前微软公司的新必应搜索和问答,能返回比传统搜索更精准的结果,并且附带资料链接。
(4)知识问答及推送。利用ChatGPT的对话能力,提高知识内容的交互性和个性化,同时根据用户的输入和反馈不断学习和优化,根据用户的个性化需求和兴趣来生成和推荐文本等。
(5)成果审核。引入标签、识别模型等AI能力来辅助成果审核人员的工作,提升审核人员的效率及准确度。
(6)分析和解释数据。通过学习数据集和模型,类ChatGPT大模型技术可以用于生成数据可视化、提供数据洞察、解释模型结果等,帮助用户理解和利用数据。
(7)知识标引。利用AI技术,对知识内容进行自动标注、分类、聚类等操作,提高知识的可检索性和可复用性。
(8)论文阅读。提供文章或文档摘要、论文写作助手、论文阅读平台等,也可以利用AI技术总结分析用户对论文的评价和反馈等。
(9)智能翻译。类ChatGPT大模型技术可以实现多语言之间的智能翻译,其效果超越一般翻译软件,可以用来翻译处理智库知识库的外语资料。综上所述,类ChatGPT大模型技术与智库研究工作场景的融合度较高,对提高研究人员的工作效率和决策支撑的质量有很大帮助。随着技术进一步发展,未来还会出现更多的创新应用场景。
4.2 类ChatGPT大模型技术在智库落地的模式探索
目前类ChatGPT大模型在智库落地主要有3种模式:一是调用大模型应用程序接口(application program interface,API);二是部署领域模型,即垂直行业模型;三是基于模型公开架构自研。
(1)直接调用大模型API。可以直接利用成熟类ChatGPT大模型的能力,其优点是启动成本低,缺点是差异化及控制范围受到一定限制。2023年3月,OpenAI开放ChatGPT API(基于GPT-3.5-turbo模型),并大幅调低了调用价格,进一步降低了企业将ChatGPT集成到自有应用和服务的门槛,国内大模型厂商如百度也推出了文心大模型API调用服务。
(2)部署领域模型。精调领域模型,优点是可以让大模型更好地符合特定行业及场景需求,缺点是目前商业模式不够明晰。目前国内外大模型巨头及行业龙头企业都有联合探索内容资源,管理垂直行业模型落地的案例。例如,百度联合人民网发布“人民网–百度·文心”行业大模型。摩根士丹利从2022年开始探索应用GPT利用其智力资源,例如,GPT-4能对该公司数十万页的知识和分析报告(涵盖投资策略、市场研究和评论及分析师见解)进行快速检索和综合,为内部员工提供智能聊天机器人,帮助其快速找到相关的信息。另外,该公司研究部门还使用GPT-3生成金融报告的摘要,通过对GPT-3进行微调,使其能够理解金融术语和数据,并根据给定的标题或关键词生成简洁的报告摘要,以节省分析师的时间和精力,提高其工作效率和报告质量。该公司数据与创新主管杰夫·麦克米兰(Jeff McMillan)认为该项目可能是迄今为止将人类的建议与技术结合的最佳范例。
(3)基于模型公开架构自研。可以定制或优化模型、数据和参数,优点是更符合特定行业及企业的需求,缺点是需要较多资金和技术投入,公开架构技术性能可能不如ChatGPT。美国市场情报公司AlphaSense是将自主研发AIGC技术赋能情报搜索及服务的成功案例。AlphaSense的AI技术由自有团队历经10多年的时间研发完善,利用机器学习和自然语言处理,使专业人士能够轻松从数千个来源和数十亿个数据点中提取见解。2023年4月,谷歌母公司Alphabet旗下投资公司CapitalG宣布,向AI市场情报公司AlphaSense投资1亿美元。CapitalG表示,AlphaSense聚合了超过10,000个数据源,通过分析数据编制索引信息,联动人工智能,可以提供更准确、更个性化的搜索结果。
央企智库普遍都建立了包含大量资料数据和研究成果的知识库,研究如何利用已有的知识库将ChatGPT能力适配到智库研究领域很有必要,同时需要研究利用与用户的对话历史记录等个性化数据,来训练个性化的ChatGPT模型。综合考虑实际情况及3种模式的适应性,央企智库部署经过微调的垂直行业模型是相对比较合理的模式。
4.3 类ChatGPT大模型技术应用于智库可能存在的风险
以ChatGPT为代表的生成式人工智能所展现出的强大“类人性表达”能力使科研活动中的知识获取途径从检索式向生成式转变,AI将分担越来越多的人类认知工作,导致科研活动中人类智力参与程度的降低。而人类参与程度的降低将带来两方面的潜在风险:一是研究者失察引起的信息质量风险,即AI所生成的内容具有事实性错误或者存在违反人类价值之处;二是研究者使用AI生成物引起的欺诈舞弊风险,即研究者在论文撰写中使用AI生成物,将AI作品视为自己的作品。
目前,国家监管部门已经注意到类ChatGPT大模型技术的潜在风险,并出台了相关政策强化治理。例如,中央网信办2023年4月发布《生成式人工智能服务管理办法(征求意见稿)》,明确了生成式AI应用服务提供者、技术支持者和服务使用者等各方的责任,指出了生成内容和训练数据必须符合伦理道德及合规要求。央企智库作为生成式AI的使用方,有必要基于国家政策法规进一步细化相关措施以规避风险,例如,加强对AI生成内容的审核和验证,另外,还需要注意智库信息安全与隐私问题及知识产权问题。
5 央企智库数智化能力平台持续运营关键要素
央企智库数智化能力平台需要通过完善流程机制来保障内容资源的循环生产、沉淀、聚合、共享和使用。强有力的组织及资源保障、融合业务场景,以及建立高效的运营机制、反馈改进机制和资源治理机制,是智库数智化能力平台可持续发展,最大化支撑央企智库决策支撑的关键要素。
5.1 设立“领导小组+实施团队”,提供强有力的组织和资源保障
央企智库数智化能力平台执行组织是智库能力建设及可持续运营的基础保障之一。智库体系执行组织由运营领导小组和运营实施团队两部分构成。
(1)运营领导小组。运营领导小组须由智库高层领导人员挂帅,并担任领导小组组长角色。所有部门领导均为该领导小组的成员,领导小组的职责是牵头制定智库数智化能力建设目标,协调各方资源和工作。
(2)运营实施团队。运营实施团队是智库能力平台运营的核心团队,主要职责是组织和推进智库体系的管理制度、流程及规范的设计和执行,负责智库体系的内容资源规划、知识管理文化宣传和推广工作,并组织开展内外部知识交流活动,另外,还需负责央企智库数智化能力平台的建设与维护。
以中国交通建设集团有限公司为例,该集团明确了下属战略研究院为集团智库机构。战略研究院在研究总院理事会的领导下,明确了智库人员的岗位和编制,确保专职人员到位,并且充分利用基层单位的信息渠道和专业水平,确保兼职人员的精力投入。
5.2 与业务融合,构建情景化智库知识管理体系
智库数智化能力平台需要与智库研究主要业务紧密结合,将研究流程固化到平台上,才能持续地沉淀和积累更多的智力知识和经验,更好地发挥作用。例如,可以通过将企业组织内的业务流程、管理流程固化到智库数字化平台,从而与知识沉淀、知识共享过程捆绑,实现对智库内部基础内容资源的归集,具体做法如下。
(1)对于成果类资源归集,可以将成果发布审核流程固化到平台,审核完成,成果即沉淀。
(2)对于外购资料归集,可以在资料报销流程中加入分享培训资料节点。
(3)对于项目/团队自采资料归集,可在资料报销流程中增加分享资料节点。
除此之外,还要建立与需求相结合的资源沉淀模式,例如,中国船舶集团某研究所将设计过程中的问题记录在协同设计平台的问题管理模块中,通过平台实现对问题的跟踪、追溯、改善及落实,有效地提升全价值链的知识共享和知识创新能力。
5.3 建立以用户为中心的运营机制和治理机制
智库数智化能力平台的持续运作需要建立以用户(包括企业管理层等智库用户及智库研究专家)体验为中心的机制,高效、精准、充分释放知识的价值,提供个性化服务,强调知识的实时性、可获得性及自助式。要通过数智化技术实时了解、分析智库数智化能力体验、知识应用、成果利用等情况,并根据分析评估结果持续改进。以中交第四航务工程勘察设计院为例,该院2018年开始系统地推动知识管理平台建设,经过持续优化,知识的丰富程度和平台应用的便捷性不断提高,有效推动了科研创效。
同时,需要建立资源治理机制,在数据、资料、成果、专家等不同类型的知识资源中,找出运营关键点(如质量要求标准、价值体现等),实施差异化治理。对于数据资源,板块负责人需要重点核实数据口径,做好数据更新及变更说明,同时,对数据质量进行检验,对数据的准确性负责;对于网络公开的免费资料,板块负责人需要对监测对象进行定期评估、更新和补充,并对资源内容、质量进行审核,确保分类及标签设置的正确性;对于外购资料,板块负责人需要对采购资源/报告的使用情况进行定期评估,确保采购资源/报告被有效利用,同时根据评估结果审核采购资源/报告的质量,确认可持续购买的必要性;对于成果报告,板块负责人需要定期对成果资源的使用情况进行统计和分析,评估成果的参考价值和复用性;对于专家资源,板块负责人需要定期更新专家信息,对专家服务质量及专家工作室的运营情况进行评估。
6 结语
央企智库数智化能力建设将有助于智库整合优势资源,提升智慧决策支持能力和水平。天翼智库经过1年多的探索实践,通过数字化能力建设和共享机制的优化实现了资料、数据和成果的共享,大幅提升了知识资源和成果的利用率,超过90%的研究人员认为对工作帮助很大。央企智库数智化能力建设需要以用户为中心,以需求和问题为导向,以是否提升研究效率为判断标准,探索应用类ChatGPT技术,构建以数据为基础、以知识为核心、以服务为宗旨的数智化智库能力体系。央企智库数智化能力建设还需要加强组织保障、融合核心业务流程、完善运营和治理机制,保障数智化能力平台的持续运行和优化升级。
作者单位:中国电信股份有限公司研究院