- BOB半岛·(中国)官方网站数字化转型对企业有哪些好处?
- BOB半岛·(中国)官方网站拓尔思2023年半年度董事会经营评述
- BOB半岛·(中国)官方网站数字人才“养成记”
- BOB半岛记者专访青科会学术委员会主席陆朝阳
联系人: 梦总
手机: 13800000000
电话: 400-123-6789
邮箱: admin@meiguhulan.com
地址: 广东省广州市BOB半岛·(中国)官方网站
BOB半岛·(中国)官方网站拓尔思2023年半年度董事会经营评述
BOB半岛·(中国)官方网站拓尔思2023年半年度董事会经营评述近年来,国内数字经济规模维持着较高的增长速度,数字经济增速也远高于GDP整体的增长速度,数字经济正在成为稳定经济增长的重要力量。顶层设计、经济转型、是数字经济的三大驱动力。从政策层面看,数字经济政策定调级别高,已上升为国家战略。从经济层面看,长期而言以数字经济为代表的新兴产业是转型期的经济发动机。二十大报告提出,“加快发展数字经济,促进数字经济和实体经济深度融合,打造具有国际竞争力的数字产业集群”。
2022年1月,国务院发布《“十四五”数字经济发展规划》,从数字基础设施、大数据、产业数字化转型、数字产业化等多方面规划了数字经济发展前景。
2022年7月,国务院发布公告,同意国家发改委牵头联合中央网信办等20个部委建立数字经济发展部际联席会议制度,强化了数字经济发展的顶层设计。
2022年10月,国务院在第十三届全国人民代表大会常务委员会第三十七次会议上就数字经济发展情况进行报告,并且重点提及了核心技术攻关、数字基础设施建设、数字产业创新发展、产业数字化转型等工作安排。同时,在二十大报告中再次提及建设数字中国,密集政策推动下数字经济有望迎来快速发展。
2023年政府工作报告中提到数字经济不断壮大,新产业300832)、新业态、新模式增加值占国内生产总值的比重达到17%以上。推动产业向中高端迈进,促进数字经济和实体经济深度融合。加快建设现代化产业体系,大力发展数字经济,提升常态化监管水平,支持平台经济发展。从地方来看,各地政府工作报告对数字化转型的目标和路径着墨较多。例如上海市提出“着力推动城市数字化转型,加快建设具有世界影响力的国际数字之都”;北京市提出“加快建设全球数字经济标杆城市,加快智慧城市建设”;浙江省致力于做强做优做大数字经济,大力实施数字经济“一号发展工程”等。2023年6月,财政部、工业和信息化部联合发布《关于开展中小企业数字化转型城市试点工作的通知》,拟分三批组织开展中小企业数字化转型城市试点工作。支持试点城市选择重点行业和相关中小企业,梳理行业共性和企业个性需求,采取市场化手段公开遴选数字化服务商,支持数字化服务商为被改造企业提供诊断、咨询等服务,开发集成“小快轻准”的数字化服务和产品,供企业自愿选择,开展数字化改造。同时,总结集成通用性强、效果好的数字化解决方案,推动跨区域复制推广,放大政策效果。
当前,数据已成为重要的生产要素,大数据产业作为以数据生成、采集、存储、加工、分析、服务为主的战略性新兴产业,是激活数据要素潜能的关键支撑,是加快经济社会发展质量变革、效率变革、动力变革的重要引擎。党中央、国务院高度重视大数据产业发展,频繁出台数据要素相关政策文件,推动数据要素市场深化改革,推动实施国家大数据战略。
2022年3月,《中央国务院关于加快建设全国统一大市场的意见》提出加快培育数据要素市场,建立健全数据安全、权利保护、跨境传输管理、交易流通、开放共享、安全认证等基础制度和标准规范,深入开展数据资源调查,推动数据资源开发利用。
2022年7月,《数据出境安全评估办法》国家互联网信息办公室令第11号文件出台,提出了数据出境安全评估的具体要求,规定数据处理者在申报数据出境安全评估前应当开展数据出境风险自评估,并明确了重点评估事项。此外,还明确了数据出境安全评估程序、监督管理制度、法律责任以及合规整改要求等。
2022年12月,《中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》从数据要素、流通交易、收益分配、安全治理四方面初步搭建我国数据基础制度体系,提出20条政策举措,包括提出构建数据基础制度体系,促进数据合规高效流通使用,建立保障权益、合规使用的数据产权制度,建立合规高效、场内外结合的数据要素流通和交易制度,建立体现效率、促进公平的数据要素收益分配制度,建立安全可控、弹性包容的数据要素治理制度。2022年12月9日,财政部发布《企业数据资源相关会计处理暂行规定(征求意见稿)》,拟规范企业数据资源相关会计处理,强化相关会计信息披露,发挥数据要素价值,服务数字经济发展和数字中国建设。
国家的顶层设计逐步对数据要素各环节提出更细致的目标和要求,为推动数据在更大范围内有序流动和合理集聚、进一步促进数据价值转化应用指明了方向。企业数据资源相关会计处理规定的出台,将极大地激活数据要素的活力,数据要素产业市场有望迎来井喷式发展,以数据为核心驱动的数字经济将迎来大爆发。根据国家工业信息安全发展研究中心测算,“十四五”期间我国数据要素市场规模预计2025年将突破1749亿元,复合增速将达到26.3%,整体上进入高速发展阶段。
2023年7月,人民银行发布的《中国人民银行业务领域数据安全管理办法(征求意见稿)》提出,鼓励数据处理者在保障安全合规前提下,积极促进数据高效流通和创新应用。
2023年上半年,多个省市已相继发布“数据要素”政策规划。北京市印发的《关于更好发挥数据要素作用进一步加快发展数字经济的实施意见》提出,形成一批先行先试的数据制度、政策和标准。推动建立供需高效匹配的多层次数据交易市场,充分挖掘数据资产价值,打造数据要素配置枢纽高地。促进数字经济全产业链开放发展和国际交流合作,形成一批数据赋能的创新应用场景,培育一批数据要素型领军企业。力争到2030年,北京市数据要素市场规模达到2000亿元,基本完成国家数据基础制度先行先试工作,形成数据服务产业集聚区。上海市印发的《立足数字经济新赛道推动数据要素产业创新发展行动方案(2023-2025年)》明确,到2025年,上海数据要素市场体系基本建成,国家级数据交易所地位基本确立;数据要素产业动能全面释放,数据产业规模达5000亿元,年均复合增长率达15%,引育1000家数商企业;建成数链融合应用超级节点,形成1000个高质量数据集,打造1000个品牌数据产品,选树20个国家级大数据产业示范标杆;数据要素发展生态整体跃升,网络和数据安全体系不断健全,国际交流合作全面深化。
加强数字政府建设是适应新一轮科技和产业变革趋势、引领驱动数字经济发展和数字社会建设、营造良好数字生态、加快数字化发展的必然要求,是建设网络强国、数字中国的基础性和先导性工程,是创新政府治理理念和方式、形成数字治理新格局、推进国家治理体系和治理能力现代化的重要举措,对加快转变政府职能,建设法治政府、廉洁政府和服务型政府意义重大。
2022年2月,《国务院关于加快推进政务服务标准化规范化便利化的指导意见》国发〔2022〕5号文件从四个方面部署了重点工作任务:一要推进政务服务标准化。二要推进政务服务规范化。三要推进政务服务便利化。四要全面提升全国一体化政务服务平台服务能力。
2022年4月,《国务院办公厅关于印发2022年政务公开工作要点的通知》国办发〔2022〕8号文件主要提出了五方面重点工作要求,持续深化政务公开,更好发挥以公开促落实、强监管功能。
2022年6月,国务院印发《关于加强数字政府建设的指导意见》国发〔2022〕14号文件,明确了数字政府建设的七方面重点任务:构建协同高效的政府数字化履职能力体系;构建数字政府全方位安全保障体系;构建科学规范的数字政府建设制度规则体系;构建开放共享的数据资源体系;构建智能集约的平台支撑体系;以数字政府建设全面引领驱动数字化发展;加强党对数字政府建设工作的领导。
2022年9月,《国务院办公厅关于印发全国一体化政务大数据体系建设指南的通知》国办函〔2022〕102号文件明确了全国一体化政务大数据体系建设的目标任务、总体框架、主要内容和保障措施,重点从统筹管理一体化、数据目录一体化、数据资源一体化、共享交换一体化、数据服务一体化、算力设施一体化、标准规范一体化、安全保障一体化等八个方面,组织构建全国一体化政务大数据体系,推进政务数据依法有序流动、高效共享,有效利用、高质赋能,为营造良好数字生态,提高政府管理服务效能,推进国家治理体系和治理能力现代化提供有力支撑。上述系列政策文件的出台是推进国家治理能力和治理体系现代化的重要举措,为下一阶段数字政府建设指明了方向。
据IDC(国际数据公司)预测,在“十四五”规划和数字政府政策的引导下,数字政府市场迎来重要发展窗口期,整体市场到2025年将保持相对高速的增长,预计到2026年将达到2173亿元人民币的市场规模,复合增长率(CAGR)为12%,是有效推动数字中国建设的重要组成部分。
信创旨在实现信息技术领域的自主可控,保障国家信息安全。其核心在于通过行业应用拉动构建国产化信息技术软硬件底层架构体系和全周期生态体系,解决核心技术关键环节“卡脖子”问题。信创产业是数字经济、信息安全发展的基础,也是“新基建”的重要内容,将成为拉动中国经济增长的重要抓手之一。在地方政府中,以安徽省、辽宁省、福建省等为代表的地方政府发布的政策文件中,加速企业信创产品国产化替代,赋能企业数字化转型,以信创产业为主攻方向,加快企业新一代信息技术应用创新也多有提及。
中央全面深化改革委员会第二十七次会议审议通过《关于健全社会主义市场经济条件下关键核心技术攻关新型举国体制的意见》。中央局2023年1月31日第二次集体学习会议强调,要加快科技自立自强步伐,解决外国“卡脖子”问题,健全新型举国体制,强化国家战略科技力量。2023年3月8日,《学习时报》刊发中国电子党组、董事长曾毅的署名文章《以新型举国体制打造网信事业核心战略科技力量》。2023年3月,中央、国务院印发了《党和国家机构改革方案》,提出组建中央科技委员会,加强党中央对科技工作的集中统一领导,统筹推进国家创新体系建设和科技体制改革,研究审议国家科技发展重大战略、重大规划、重大政策,统筹解决科技领域战略性、方向性、全局性重大问题,研究确定国家战略科技任务和重大科研项目,统筹布局国家实验室等战略科技力量,统筹协调军民科技融合发展等。作为党中央决策议事协调机构,中央科技委员会一要加强科技工作统一领导,体现高层对科技产业的高度重视。机构的改革表明这次党和国家机构改革,加强党中央对科技工作的集中统一领导,组建中央科技委员会,中央科技委员会办事机构职责由重组后的科学技术部整体承担;二是中央科技委员会的组建对高水平科技自立自强具有重大战略意义。新型举国体制、科技创新全链条管理、科技成果转化、促进科技和经济社会发展相结合等职能将进一步加强,对加强基础科学研究、集中力量在一些“卡脖子”工程上取得成绩等方面具有重要的战略性意义。
市场普遍认为,未来五年是“大信创”发展的关键时期,发展空间广阔。据《2022中国信创生态市场研究及选型评估报告》显示,2022年信创产业规模达9920亿元,近五年复合增长率为35.7%,预计2025年将突破2万亿元。
人工智能是引领新一轮科技和产业变革的战略性技术。2022年12月,全球人工智能研究机构之一的OpenAI公司推出了基于GPT-3.5的新型AI聊天机器人ChatGPT,在发布两个月后拥有1亿用户,成为史上用户增长最快的应用。2023年3月,OpenAI正式推出多模态大模型GPT-4,该模型可对图文多模态输入生成应答文字,以及对视觉元素的分类、分析和隐含语义提取,并表现出优秀的应答能力。GPT-4被业界认为是具有里程碑意义的一代,因为多模态的GPT-4会从视觉角度和视觉-文字语义融合方面涌现出更多的能力。继GPT-4之后,谷歌、微软、百度、阿里、腾讯、华为等海内外科技公司纷纷加速了通用大模型的研发,并将陆续推出各自的大模型。未来,各科技厂商或将更加聚焦于大模型的产品定位和商业化落地,越来越多的知识计算能力会融入到行业大模型中,行业AI应用的渗透率将全面提速。近年来,我国陆续出台多项政策,鼓励人工智能行业发展与创新。《新一代人工智能发展规划》《关于支持建设新一代人工智能示范应用场景的通知》《新型数据中心发展三年行动计划(2021—2023年)》等产业政策,为人工智能产业发展提供了保障。我国还依托领军企业建设了10余家国家新一代人工智能开放创新平台,依托地方建设国家新一代人工智能创新发展试验区和国家人工智能创新应用先导区等。党的二十大报告指出,推动战略性新兴产业融合集群发展,构建人工智能等一批新的增长引擎,加快发展数字经济,促进数字经济和实体经济深度融合。上海深入贯彻落实国家发展人工智能的战略,将人工智能作为重点发展的三大先导产业之一,已成为全国发展人工智能产业的排头兵和先行者。
2023年2月,上海市人民政府副市长李政在2023全球人工智能开发者先锋大会上表示,上海将全力夯实产业基础,加快多模态通用大模型研发攻关,积极培育智能内容生成、科学智能等新赛道。北京市经济和信息化局在北京人工智能产业创新发展大会上,正式发布《2022年北京人工智能产业发展》。中提出,全面夯实人工智能产业发展底座,支持头部企业打造对标ChatGPT的大模型,着力构建开源框架和通用大模型的应用生态。北京将持续推动建设具有全球影响力的人工智能创新策源地。在中央局集体学习强调要加强基础研究的会上,科技部部长王志刚称,AI这个领域是大方向、大领域,并且它的影响绝不仅仅在科技领域本身,可能还涉及在其他领域的赋能应用。这方面科技部已经作了很多部署:包括AI本身技术发展的一些课题,已经部署了很多年;中国首先提出AI治理方面的“八项原则”;在AI转化应用方面最近推出智能码头等若干个示范应用场景,推动AI转化应用。
大模型作为政府和企业推进人工智能产业发展的重要抓手,在识别、理解、决策、生成等AI任务的泛化性、通用性、迁移性方面都表现出显著优势和巨大潜力。大模型的发展是大势所趋,大模型未来将会助推数字经济,为智能化升级带来新范式。随着GPT-4大模型的最新发布,多模态技术让AIGC可应用的广度不断扩展,可跨文字、图像、音频、视频等多种类型数据进行关联,提高内容生产能力。据Gartner预测,至2023年将有20%的内容被生成式AI所创建,至2025年,生成式AI产生的数据将占所有数据的10%(目前不到1%)。另据全球著名风险投资公司红杉资本预测,生成式AI将产生数万亿美元经济价值,到2025年,国内生成式AI应用规模有望突破2000亿元。
2023年8月,由国家互联网信息办公室等七部门联合发布的《生成式人工智能服务管理暂行办法》(以下简称《办法》)于8月15日正式施行,这也是我国首个针对生成式人工智能产业的规范性政策。《办法》提出国家坚持发展和安全并重、促进创新和依法治理相结合的原则,采取有效措施鼓励生成式人工智能创新发展,对生成式人工智能服务实行包容审慎和分类分级监管。在促进发展具体措施上,《办法》明确鼓励生成式人工智能技术在各行业、各领域的创新应用,生成积极健康、向上向善的优质内容,探索优化应用场景,构建应用生态体系;鼓励生成式人工智能算法、框架、芯片及配套软件平台等基础技术的自主创新,参与生成式人工智能相关国际规则制定。《办法》明确生成式人工智能服务提供者应当依法开展预训练、优化训练等训练数据处理活动,使用具有合法来源的数据和基础模型;涉及知识产权的,不得侵害他人依法享有的知识产权;涉及个人信息的,应当取得个人同意或者符合法律、行政法规规定的其他情形;采取有效措施提高训练数据质量,增强训练数据的真实性、准确性、客观性、多样性。此外,明确了数据标注的相关要求。
公司作为人工智能、大数据和数据安全产品及服务提供商,为各行业用户的数智化赋能。公司业务根据行业应用的不同,可划分为数字政府、融媒体、金融科技、数字企业、公共安全五个版块;根据技术领域的不同,可划分为人工智能、大数据、数据安全、信创四个领域;根据服务模式的不同,又可划分为软件产品、大数据服务、订阅制SaaS服务、软硬一体化产品四种模式。
数字政府是公司的成熟业务版块,主要面向各级政府和职能部门提供政府网站集约化、智慧监管、政务舆情、产业招商、数字机关等领域政务应用的解决方案、软件产品及数据服务。政府网站集约化主要包括政府网站群、政务公开平台、政策文件库、政务新媒体矩阵、政民互动、用户智能推送服务、政务虚拟人等。智慧监管主要聚焦金融监管,具体包括非法集资监管和非法金融活动监管。政务舆情主要帮助政府单位及时了解公众对政府的重大政策、重要决策部署、政务工作的评价、社会公共事件的意见、情绪与观点等,进行网络政务舆情监测,帮助用户有效监测舆情态势。产业招商主要帮助政府招商部门、产业研究部门等围绕产业发展全生命周期,基于产业经济发展科学规划,实现产业招商、产业治理、政策惠企与精准施策、区域强链补链、产业经济运行监测的全流程数字化、智能化、精准化,帮助建立“一企一档、一人一档、园区档案、政策档案、产品档案、机构档案”,为地方产业发展提供一站式精准服务。数字机关主要包括政务运行知识底座、政策智能研读、机关事务知识问答、政务知识搜索等,为提高共性办公应用、机关运行效能、政府决策科学化水平进行数智赋能。
目前,公司的数字政府业务主要以“软件产品+大数据服务+订阅制SaaS服务”的融合模式为客户提供服务。政府用户已经覆盖80%的中央和国务院机构,60%的省级政府,50%的地市政府。
报告期内,公司在数字政府方面,省级政府网站群、政务公开平台等业务进入运维期,地市级政府网站集约化业务与政务新媒体业务稳步增长,政务大模型的应用探索需求旺盛。公司将持续拓展生态合作,定位专精特新,基于云和数据服务以及政务行业大模型开辟新赛道,增加新商机。在智慧监管方面,公司的防非处非SaaS云产品链条更加完整,经济金融风险监测方面加大了业务创新探索,如基于大众媒体情绪和公开财务债务测算地方城投债务真实风险。在智慧水利方面,公司控股子公司广拓公司推出了融合知识图谱与行业大模型的水利知识服务平台解决方案,得到多地水利部门的高度认可。
融媒体是公司的成熟业务版块,主要面向各级新闻媒体单位围绕新闻生产策、采、编、发、评、运、屏全流程提供融媒体内容生产、用户行为资产、媒体大数据等综合服务。融媒体内容生产服务平台是以内容资产为核心的新一代数据型媒体业务平台,涵盖了报、网、端、微、视和自媒体平台的全流程内容生产发布管理。该平台由数据资源聚合、融合生产创作、选题策划分析、传播效果分析、协调指挥调度、用户资产运营、大屏综合管理等多个平台组成。用户行为资产管理平台是从各个媒体传播渠道搜集的读者用户的静态信息和用户行为信息进行汇集和整理,基于海量用户特征和挖掘技术对用户建立标签化信息全景,形成360°用户画像完善的数据管理及输出流程,满足个性化推荐服务等多种业务应用的需要。媒体大数据云服务是以“知识库+智能语义”的方式对资讯数据进行结构化标引,通过对数据的精细化运营加工,提供多元垂直数据型分析应用场景,贯穿媒体业务的各个环节,为媒体用户提供高信源、精加工、个性化的数据产品云服务,提升媒体大数据的价值密度。目前,公司的融媒体业务主要以“软件产品+大数据服务”的融合模式为客户提供服务。公司融媒体用户已经覆盖了72%的中央媒体,61%的省级媒体,40%的行业媒体。
报告期内,融媒体业务版块经营业绩稳步增长,营业收入较上年同期增长了17.56%。其中,行业报数据业务在稳步增长,央国企融媒体平台建设在加快推进。随着拓天.M媒体行业大模型发布,AIGC服务在媒体领域的落地将迎来新一波商机。
金融科技是公司的成长业务版块,主要面向银行业金融机构提供智能风控、智能消保、普惠助贷、绿色金融等金融科技领域的软件产品及数据服务。智能风控云服务主要面向银行、投研机构提供全面监控海量金融实体风险,实现高频异构数据自动化分析、风险知识化分析、跨场景知识延展和异动风险监测。智能消保管控中台面向银行业消保、业务部门,打通各业务系统消保数据,从非结构化投诉数据挖掘相关知识并分析应用,实现对各渠道消保数据的科学精细化管理。普惠助贷与绿色金融主要面向银行基于特色产业标签与企业价值分析模型,快速挖掘绿色产业、高新技术产业细分领域下的潜力、低风险、优质客群,精准放贷。目前,公司的金融科技业务主要以“软件产品+大数据服务+订阅SaaS服务”的融合模式为客户提供服务。公司智能风控业务的用户已经覆盖了5大国有银行、3大政策性银行、92%的股份制商业银行。
报告期内,金融科技业务版块实现了经营业绩的大幅提升,营业收入较上年同期增长了95.68%,其中传统业务稳中微增,主要增长来自AI与数据业务,消保、风控延展类业务需求较为旺盛。
数字企业是公司重点拓展业务版块,主要面向能源、消费电子、餐饮等行业用户提供智能内容管理、企业融媒宣传、企业声誉风险管理、企业开源情报等企业应用。目前,公司的数字企业业务主要以“软件产品+订阅制SaaS服务”的融合模式为客户提供服务。公司数字企业版块订阅制SaaS服务用户已经覆盖了中国能建601868)、中国铁路、国投集团、国家电网、南方电网、中国人民保险、潍柴动力000338)、海尔集团、鲁信集团、百胜集团、中国通用、上汽通用、九毛九集团、山东航空、浙江国贸等大型企业。
报告期内,央国企客户融媒体项目需求旺盛,公司加大了央国企客户的开拓,新增了航天科工集团等客户。
公共安全是公司的成长业务版块,主要面向网信、公安、防务等涉密和安全机构,提供公安情指行(情报、指挥、行动)、开源情报、知识图谱、数据安全等领域的产品和数据服务。目前,公司的公共安全业务主要以“解决方案+软硬产品+数据服务”的融合模式为客户提供服务。
报告期内,公安、防务等业务版块的软件产品营业收入稳定增长,较去年同比增长了33%。边界安全等硬件产品营业收入,较去年同比增长了31.43%。
公司具有20年的自然语言处理(以下简称:NLP)研发经验,是国内最早研发人工智能技术的企业之一,在NLP、知识图谱、OCR、图像视频结构化等领域都具备自主可控的多模态内容处理底层技术,处于行业领先地位。公司一直密切关注人工智能的前沿技术发展,并积极探索相关技术在产品及业务中的应用。
报告期内,拓天大模型聚焦优势行业,融合公司多年在NLP领域的综合研发实力及关键技术持续创新能力,利用自有的高质量数据进行预训练。2023年6月底,公司正式发布了“拓天大模型”,推出适用媒体、金融、政务的三大行业大模型,具备较好的合规性、安全性、准确性、可控性,可满足行业用户的专业化智能创新需求。同时,公司还启动了拓天网信行业大模型、公安行业大模型、法律大模型的业务场景规划与预训练。
公司基于自有的1000亿+互联网媒体资讯数据,100亿+官媒数据,200万+人民数据,14大类知识标引规范,12000+知识标引规则作为专业训练数据,打造了媒体专业大模型,主要功能覆盖内容生产智能助手、新一代搜索与推荐、多模态传播与服务三大业务场景。
实时接入最新、最热和具有公信力的外部互联网数据,通过大模型的能力实现媒体大数据的知识增强,应用到报社内容生产的智能选题策划环节,帮助媒体工作者更方便地从各种维度获取需要的外部互联网数据。具体应用场景包括实时新闻热点、网民最新关注、实时问答互动等。编辑记者以互动问答的方式向大模型发出指令,可要求给出特定时间段、特定领域的统计分析结果,大模型能够快速准确的给出结果,为表现结果的真实性,每个结果都会给出来源出处。
利用主流媒体垂直领域大模型的核心能力为内容生产过程赋能,通过大模型与富媒体编辑器的深度融合形成内容生产智能助手,提升编辑记者日常工作效率,具体应用包括拟定新闻标题、文章段落续写、内容智能摘要、文章风格改写、文字智能配图等。
将媒体单位自有的私域数据和行业知识相结合,提供知识搜索与推荐服务,应用于金句引用、权威法典引用、报道文集引用、权威数据素材搜集等场景,编辑记者可利用大模型实现不同来源的权威数据集的素材搜集、整理工作。可根据用户个性化的要求(比如:包含时间、标题、摘要等),将不同主题的内容数据集按照要求整理到一篇文档中,也可以对新闻报纸中包含某种关键性信息的版面进行汇总整理。
利用大模型强大的分析统计能力,对互联网采集的媒体新闻报道内容和互动数据进行分析计算,自动生成各种传播分析结果,并按照特定的报告格式进行输出。利用媒体大模型的统计分析能力,针对特定主题事件实现宣传报道的智能归纳与总结,并根据要求智能生成总结报告进行输出。
公司基于自有的110亿+金融主题数据、百亿级产业指标数据、30亿+产业要素明细数据、2亿+产业动态本体、500+以上标引维度、10000+知识标引规则、10万+产业标签作为专业训练数据,打造了金融专业大模型,主要功能覆盖智能风控、智能客服、智能投研等业务场景。
提供风险预警助手、风险报告生成助手、风险知识查询助手功能,在原有智能风控产品基础上,全面升级基础技术底座,利用大模型技术提供以下功能升级:
风险报告生成助手,在贷前尽调、贷后排查等环节,提供智能化报告生成助手,可提供报告标题生成、目录生成与报告全文生成等自动化功能,并可集成大模型插件数据智能化生成各类风险报告。
风险知识查询助手,利用自然语言输入的方式,对内部数据与知识数据实现海量数据603138)智能化搜索。
人工智能在提升投研效率和科学性方面体现了较为明显的优势,拓尔思将利用大模型推出投研智能搜索引擎与研报生成助手。
投研搜索引擎,通过自然语言处理、深度学习等人工智能技术拓宽投资信息来源,金融信息系统可抓取与投资目标相关的宏观经济指标、舆情走向和监管政策等数据,大幅提高获取信息的及时性,利用自然语言处理技术来分析新闻文章和社交媒体上的评论,更好地了解市场情绪和趋势,并根据其预测结果制定投资策略,减少投资顾问进行金融处理基础数据的工作量。
研报生成助手,利用大模型技术能力,结合数星产业大脑上百类宏观、中观、微观相关数据,提供智能化研报生成助手,自动化生成研报标题、研报目录、研报内容,并结合各类插件化数据提供精准实时数据的插入与内容生产。
客服数据智能分析助手,可对语音、文本等各类投诉数据完成客户投诉原因、投诉渠道、投诉诉求、是否高危、是否重复等核心要求完成自动化分析。
客服投诉处理助手,利用投诉知识库与投诉处理意见库等,自动化生成投诉建议处理意见、定责意见、排查意见等,提升客服处理投诉效率,降低客户投诉率。
拓尔思基于自有的300万+篇公文类数据、200万+篇政策法规类数据、8000万+篇政务资讯类数据等数据作为专业训练数据,打造了政务专业大模型,主要功能覆盖公文辅助写作、政策大脑和新一代政务互动等业务场景。
在公文写作过程中提供更快速、准确的帮助和建议,支持生成横跨多专业领域的内容建议、改进文章结构等,帮助节省作者的时间和精力,并提高公文写作的效率。
支持与内容编辑器集成,作为辅助写作助手与内容编辑过程实时交互;可指出不合适的词汇、修正语法错误、改进句子结构,并提供更生动、吸引人的表达方式,提升内容的可读性和吸引力。
支持对不同地区的产业政策,或者相同地区不同时间段政策进行比对,进一步为企业提供政策研究支持。
可应用于政府网站智能问答、办事APP实时咨询、政务服务大厅机器人引导等场景。网民通过自然语言表达自己的需求,无需复杂的菜单或过滤器,可自由地以最自然、最方便的方式来表达诉求。
公司自成立之初就从事中文全文检索技术的研发,是国内最早从事该技术领域研发的企业。在大数据技术平台方面,公司拥有完整的大数据产品矩阵,涵盖数据采集、汇聚、加工、治理、存储、共享、开放等全流程。在数据资产方面,公司2010年就自建了大数据中心,以长期服务多行业用户持续积累的开源数据为基础,拥有了规模及质量均位列业界前茅的公开信源数据,目前数据总量超1500亿+,并仍保持日均亿级数据的采集增长。
①在数据资产平台方面,公司分别对三大经营性数据资产平台进行了架构、性能、功能方面的优化迭代。
●在产业大脑平台方面,公司重构了底层4大子系统,优化了100多类数据的架构与存储,进一步提升了系统稳定性。在数据方面,对专利数据、精准营销相关线索数据等进行专项增强。在模型方面,对产业标签及各类场景项目级进行专项优化。在应用方面,进行非核心功能瘦身,提升客户体验。
②在数据技术平台方面,为提高数据中台的数据高可复用性以及数据应用开发敏捷性,公司投入了较大研发力量进行新中台架构(一中心五中台)的升级迭代。
●在数据治理、数据分析、数据存储等进行了全方位的优化,增加了数据中台云服务处理模式,为无条件落地的小B端用户大数据建设提供了简单快捷方案,降低实施落地难度,同时满足智能化需求。
●在搜索型数据库方面,公司主要聚焦信创替换以及向量数据库两个方向。今年4月,公司发布了海贝10加强版(Hybase10Pro),完成了海贝的稠密向量索引核心功能的开发。今年5月,在中国信通院组织的首批可信数据库“搜索型数据库”产品能力评测中,公司的海贝搜索数据库系统顺利完成了搜索型数据库产品能力评测。
●在数据处理方面,公司对TRSETL进行了新版本研发,完成了ElasticSearch(以下简称ES)生态兼容处理工具的升级,增强了ETL任务的断点续传能力,实现了多种CDC实时数据同步类型,新增SQL和JAR类型任务,从ETL到ELT等,使TRSETL在生态兼容、性能、处理能力等方面得到进一步提升。
在网络信息内容安全治理方面,公司主要聚焦网络低俗、饭圈乱象、网络暴力等网络生态问题的监测、追踪和分析。在内容安全审核方面,公司的文字校对云服务平台能够比较准确、全面、智能地对发布内容进行审核,包括文字类差错、敏感词过滤、常识错误等内容。在网络安全方面,公司子公司天行网安是国内最早从事网络安全和数据交换的企业,发明了国内第一台安全隔离网闸,在数据视频交换、单向导入等方面具有雄厚的技术实力。目前,公司主要面向政府、公检法、海关等单位提供以数据交换为核心的边界安全、物联网安全、大数据安全三大阵营产品线和解决方案。其中,边界安全产品在全国公安边界安全市场处于领先地位。受益于国家对数字中国建设的重视,天行网安充分发挥自身在公安行业的优势,积极参编GA/T1788.3等标准,并致力于服务公安边界安全建设。
报告期内,在边界安全产品方面,天行网安基于统一架构的边界产品升级改造,有效提高开发效率及产品性能,提升产品竞争力,已完成边界安全基础平台开发。同时,启动了数据服务安全网关和视频交换平台3.2版本的合作研发工作。
在大数据安全方面,天行网安完成了公安安全大数据平台项目开发,发布了安全管理平台V1.0。同时启动了边界运维平台(BOP)2.0版本的研发工作。
同时,天行网安未来实验室已完成天行隐私计算平台V1.1的研发,新一代FPGA隔离板卡研发也基本完成,准备进行实验局。
自2018年我国将信创纳入国家战略以来,公司已经实现了主要软件产品与国内信创领导厂家的基础产品,包括海光、鲲鹏、飞腾、龙芯等芯片,以及统信UOS、中标麒麟、银河麒麟、中科方德等国产操作系统的适配工作。公司的海贝大数据管理系统是一款从内核到系统完全国产自研的搜索型数据库,是构建搜索引擎应用的核心支撑软件。作为一款纯国产自研的搜索引擎数据库,海贝大数据管理系统支持所有数据类型,功能完备,安全可靠,兼容主流国外搜索引擎数据库常用接口,对接主流生态。美国搜索型数据库产品ElasticSearch利用开源优势,迅速成为该领域的全球领导者,我国使用量排名全球第一,且深度应用到各行业的关键系统。但ES是全球发生数据安全事件最多的数据库产品,导致我国数据安全风险极大。报告期内,公司拓展了不同行业的合作渠道,积极推进对ES搜索引擎数据库的国产替代。纯国产自研的“海贝”具备与之媲美的产品力,公司具有众多国家标杆项目成功经验以及本土化服务能力,完全可以平滑替代ES。报告期内,拓尔思进一步扩大主流产品的全面适配信创国产化,完成了TRSServer、Hybase、ETL、雷达、APIGW、DL-CKM、WCM、IDS、MAS等产品与飞腾S2500的适配测试,完成了ETL、IDS、MAS等产品与海量数据库的适配测试,配合海量数据库完成测试报告,已获互认证书。
公司拥有人工智能和大数据技术领域的通用产品,包括海蜘大数据采集平台、海聚数据融合平台、海贝大数据管理系统、天骄数据中台、智拓人工智能技术平台等,在项目中主要用于构建人工智能底座和大数据底座,为上层业务应用提供数智化能力。公司还拥有数字政府、融媒体、公共公安等领域的行业产品,包括海云集约化智能门户平台、海融智能媒体融合平台等,主要聚焦特定的业务场景。目前,公司的软件产品主要按许可组件+套数的模式进行销售。
在技术中台方面,基于公司原有微服务网关和低代码平台,研发了能力中心V1.0,并和数据中台能力接入做了内部拉通,可一键发布数据服务到能力中心,实现申请审批、流控等服务保护。数据中台可快速接入能力中心其他系统发布的能力,将数据中台变薄,让数据中台更加专注。能力中心对所有接入的数据服务能力、人工智能的能力进行申请和审批的管理、流控等,现已支撑了项目两个示范应用的运行。
在AI中台方面,公司增加了视频语义分析能力,如改进人脸搜索匹配算法,优化了低头和正脸的匹配度以及不同年龄的匹配度。
在行业产品方面,公司在海云集约化智能门户平台中持续迭代TRS校对功能,实现智能校对交互全面优化,新增工作流,优化抄送功能、政务新媒体入驻号管理等。对金融智能监管中台的架构进行了升级迭代,算法模型也进一步丰富。同时启动了金融犯罪大数据法律监督平台的研发。
公司采集的公开信源数据通过加工处理,通过不同专业模型转化成不同领域的知识数据,实现数据从资源性到经营性的数据资产变现,形成了三大数据资产平台:数家(媒体资讯)、网察(舆情)、数星(产业大脑)的格局。目前,
报告期内,在数据资源方面,公司对数百万个采集点进行了采集清理,保证了采集源的高度权威可信。同时,进一步扩大了10万+采集点,使公开可信信源的地域库、短视频数据等方向的采集能力得到高速增长,高质量多模态数据资源得到大幅充实。另外,公司还加大了数据标注服务的投入,保证数据标注质量得到不断提升。
在数据流通方面,公司已实现了三大经营性数据资产平台的数据服务产品全面细化与优化,数据要素业务也呈良好增长态势。目前,公司数据服务类OpenAPI已在北京、上海、深圳、郑州数据交易所挂牌,贵阳大数据交易所与西部数据交易中心的数据服务上架正在同步推进中。
在数据服务方面,公司大力开拓大模型预训练数据集服务业务,以数据推送服务方式为全国大模型服务厂商提供优质的中文预训练数据集。中文大模型训练需要优质且合法的数据资源,而网信办、具备新闻发布资质的单位以及其他组织机构所发布的合法稿源、长期数据,无疑具备稀缺性。目前,公司拥有规模位列业界前茅的、经过领域知识加工的权威高质量公开数据1500亿+,涵盖近10年来的报刊数据、互联网主流新闻数据、新闻资讯客户端数据、政府类门户网站数据、权威第三方平台数据及行业资讯数据等。公司正积极与多家大模型头部厂商洽谈数据服务合作业务。未来,公司有望为全国更多MaaS服务商提供不同垂直领域的高质量预训练数据服务。
在数据资产管理方面,公司积极加强与上海数据交易所的交流,共同探索数据资产入表的操作实践,持续加强对数据资源的应用场景或业务模式、原始数据类型来源、加工维护和安全保护等相关机制优化、工作细化,以全面提升公司的数据资产管理能效。
公司在经营过程中已经形成了一套“1+1=N”的数据要素商业模式。“1+1”是指一个大数据底座和一个人工智能技术底座。“N”是指行业SaaS服务集群,未来可实现N个云服务产品的拓展。“1+1=N”的商业模式主要依托拓尔思自建的大数据中心,基于自研的大数据底座和人工智能技术底座,面向政府、媒体、金融、企业等优势行业,根据不同场景封装产品,基于公司成熟营销体系迅速推向市场。这种模式实现了同一数据资源在数据资产转化方面的裂变增长,充分体现了公司深耕行业应用,深挖存量客户衍生价值的行业优势,也体现了公司高质量专业模型和知识数据的优势。
报告期内,数星产业大脑数据服务平台营业收入大幅提升,较去年同比增长了223.9%。网察大数据服务平台营业收入平稳增长,较去年同比增长了46%。
公司控股子公司广拓公司推出了天目开源情报数据服务平台V3.0,构建了全新底座,推出了三大中心(透视中心、报告整编中心、情报服务中心),初步实现了开源情报各类数据服务产品的自增长体系构建。二、核心竞争力分析
自成立以来,公司始终坚持核心技术自主研发,拥有40+发明专利、700+软件著作权,一直引领全文检索和搜索引擎数据库、自然语言处理(NLP)技术的原始创新和应用场景落地,是国内最早从事NLP研发的企业之一,专注的语义智能细分领域属于人工智能中的认知智能领域。公司从2000年开始自主研发NLP,率先将中文分词、自动分类、相似文本检索等相关技术深度集成到公司的全文检索系统中,用于商业落地。经过20多年的发展,目前,公司聚焦NLP、知识图谱、图像检索三大核心技术,结合机器人流程自动化技术,面向不同应用场景,形成了一套完整的多模态人工智能产品体系,可为广大用户提供文本、音视频、多模态等全栈AI服务能力。公司将行业知识图谱等语义知识应用于深度学习中,通过知识驱动+大数据驱动,实现AI学习效果提升。同时,公司实现了图像、视频、音频与文本的多模态融合的深度语义匹配,通过OCR识别、以图搜文、以文搜图、视频搜索、音频搜索等功能,可实现图像、声音与文本之间的跨模态语义识别与检索。公司专注20年自然语言处理技术的研发,以商业化、市场化、产业化为目的,每次迭代的人工智能技术都能及时高效地融入到各行业产品中,实现科技成果转化到技术商业化。
自1993年成立发展至今,公司已在媒体、政府等行业深耕了20年以上,在金融、安全行业也厚植了15年以上,积累了一大批行业头部标杆和优质用户,如媒体行业服务了72%的中央媒体,61%的省级媒体,40%的行业媒体等用户;政府行业服务了80%的中央和国务院机构,60%的省级政府,50%的地市政府等用户;金融行业服务了5大国有银行、3大政策性银行、92%的股份制商业银行等用户;公安行业服务了及32个省市160多个地市公安用户。长期的行业客户深耕,推动了公司行业应用向纵深发展,业务主要聚焦在内容管理、大数据、人工智能、数据和云服务等领域。公司从行业的关键场景切入,用大数据和人工智能技术解决最棘手的问题,为行业创造价值。
公司2010年自建大数据中心,以长期服务多行业用户持续累积的公开信源数据为基础,拥有了规模及质量均位列业界前茅的公开信源大数据,千亿级“全、准、新”的无监督训练数据和微调优化知识数据,可针对优势行业训练出高质量的行业大模型,满足行业用户的专业化智能创新需求。三、公司面临的风险和应对措施
公司是国内领先的拥有自主核心技术的人工智能和大数据技术及数据服务提供商。在近年来软件市场中,产品技术的研发创新能力、产业生态链的构建与运营能力越来越成为竞争焦点。目前,国内的软件市场是一个快速发展、空间广阔的开放市场,技术升级及客户信息化需求旺盛,但随着行业内新入企业增加,公司将面临更加激烈的竞争压力。如果公司不能在技术水平、成本控制、市场拓展等方面持续保持自身优势,公司的盈利能力和市场份额将会受到较大影响。
由于公司目前的主要客户是政府部门和大型企事业单位,这些客户通常采取预算管理和产品集中采购制度,一般为下半年制订次年年度预算和固定资产投资计划,审批通常集中在次年上半年,设备采购招标一般则安排在次年年中或下半年,造成公司产品销售具有上、下半年不均衡的特点。因此,公司营业收入和净利润存在较为明显的季节性特征。同时,由于软件企业员工工资性支出、无形资产摊销等成本所占比重较高,造成公司净利润的季节性波动更为明显。受销售季节性因素的影响,公司第一、二季度营业收入和净利润较少,占全年收入和利润的比重较低,甚至可能出现公司第一季度季节性亏损等情况。
近年来,人工智能和大数据技术加速发展,国家关于促进人工智能和大数据产业发展的战略规划陆续出台。当前,各行业用户热情较高、需求较旺,很多人工智能和大数据的创新应用场景随之浮现,市场参与者不断加大技术研发及市场开拓的投入,产业发展已进入场景为王、应用落地的阶段。但实践中,尽管人工智能和大数据行业空间广阔,但各类应用的实用效果、成熟度和最终用户应用水平还有待验证和提高BOB半岛·(中国)官方网站,同时也面临着成长进程反复和增速延滞的风险。因此,公司若不能发掘围绕用户实际痛点及时推出新产品和解决方案,可能会对公司的产品技术应用成熟度造成一定的影响。
随着公司业务、资产、人员规模的不断扩大,技术创新要求更高、更快,对经营效率的要求进一步提高,公司经营的决策、实施和风险控制难度将增加。虽然公司目前具有核心技术优势,但人工智能和大数据应用环境和需求的快速变化以及公司规模化扩张对公司保持持续的技术领先提出了更高的要求,如何在研发技术、研发管理方面保持持续有效的创新,并保证产品快速满足市场需求,均给公司带来一定程度的压力。
公司属于技术资本和知识资本密集型行业,人力资源是企业成败的关键因素,行业内的市场竞争也越来越体现为高素质人才的竞争。本行业企业面临的人力资源群体通常具有人员素质高、流动性大、知识结构更新快、人力成本不断上升的特点。尽管公司制定了相应的人才政策,公司仍可能会面临核心技术人员和管理人员离职的风险,以及在业务扩张过程中无法招聘到足够合格的技术人员和管理人员的风险。
公司近年来进行过重大资产重组及数次股权收购,各项收购之后公司形成了较大金额的商誉。如果未来经营状况恶化,将有可能出现商誉减值,从而造成公司合并报表利润不确定风险BOB半岛·(中国)官方网站,对公司的经营管理产生不利影响。公司将继续推动各收购子公司加强业务经营,积极进行战略协同,促进子公司核心业务向好发展,实现公司保值增值。
公司及多家子公司被认定为高新技术企业,在不同期间享受15%的所得税税率优惠政策。其次,根据财政部、国家税务总局、国家发展改革委、工业和信息化部《关于软件和集成电路产业企业所得税优惠政策有关问题的通知》(财税[2016]49号)规定,公司及下属部分子公司享受财税[2012]27号文件规定的税收优惠政策的规划布局内重点软件企业,每年汇算清缴时应按照《国家税务总局关于发布〈企业所得税优惠政策事项办理办法〉的公告》(国家税务总局公告2015年第76号)规定向税务机关备案,公司及下属部分子公司企业所得税税率按10%执行。另外,根据财政部、国家税务总局《关于软件产品增值税政策的通知》(财税[2011]100号),增值税一般纳税人销售其自行开发生产的软件产品,对其增值税实际税负超过3.00%的部分实行即征即退政策。
如果未来国家对软件产品、软件企业、高新技术企业的税收优惠政策发生变化,或者公司及子公司未来高新技术企业资格复审未通过国家主管部门认定,将会对公司经营业绩产生一定的负面影响。
尽管公司的主要客户为政府部门和大型企事业单位等一些资信良好、实力雄厚、发生坏账风险较小的客户,但随着公司经营规模的扩大,应收账款的余额可能会逐步增加,如果客户经营状况发生重大变化导致其偿债能力受影响或公司采取的收款措施不力,发生坏账的可能性将会加大。四、主营业务分析
报告期内,公司实现营业总收入44,442.96万元,较上年同期同比增长4.58%;实现归属于上市公司股东的净利润6,964.41万元,较上年同期同比降低6.68%。实现归属于上市公司股东的扣除非经常性损益的净利润5,029.36万元,较上年同期同比增长8.52%;报告期末,归属于上市公司股东的净资产为338,485.25万元,较上年末同比增长25.97%。
2023年上半年,公司紧抓国家数字经济发展新机遇,在行业大模型方面取得了新进展,发布了“拓天大模型”。公司聚焦本身的优势行业,在金融、媒体、政务三大领域推出了三大行业大模型,在赋能千行百业的数字化、智能化转型过程中占有领先优势。报告期内,公司业绩变化的主要原因如下:
1、受益于国家加快发展数字经济,把握数字化、网络化、智能化方向,大力推进数字产业化和产业数字化,重视通用人工智能发展,金融、媒体行业客户对大模型的创新应用需求旺盛。其中,AIGC业务实现了营业收入782.18万元,较上年同期同比增长206.02%,主要业务涉及消保报告自动写作、媒体智能辅助写稿等应用。公司的金融科技业务实现了经营业绩的大幅提升,其中传统业务稳中微增,主要增长来自人工智能与数据业务,消保、风控延展类业务需求较为旺盛。今年上半年,公司在金融消保和风控领域的签约用户包括中国银行、国家开发银行、民生银行、招商银行、平安银行、北京银行、上海浦发银行、上海农商银行、渤海银行、中国人保601319)等。在这些项目中,公司将陆续实现金融行业大模型在消保和风控领域应用,如消保智能审查、消保智能客服、智能风控助手等。大模型也迅速渗透传媒业,促进了数智融合。从目前来看,大模型在内容管理、主体责任、传播阵地等方面均对现有的意识形态管理模式提出了新的要求。建设我国自有的主流媒体垂直领域大模型是落实国家科技创新发展战略的重要举措,也是对冲美西方ChatGPT人工智能模型对我国意识形态领域冲击的必然选择。随着拓天.M媒体行业大模型发布,大模型应用在媒体领域的落地将迎来新一波商机。公司已经与传播大脑签定了战略合作协议,联合发布了“传播大模型”,后续双方将共同开拓该领域业务。另外,公司已中标人民日报某项目,在落地过程中,公司将与用户共创更多媒体AIGC应用。
2、报告期内,公司的云和数据服务业务实现营业收入18,073.39万元,较上年同期同比增长21.68%。大模型的自主性、可控性、安全性是必要且需要重点关注内容,提高这三方面能力是落地部署的前提条件之一。权威主流媒体高质量内容数据有利于推动通用大模型实现中文特性增强和价值观对齐。公司与深圳云天励飞技术股份有限公司(股票代码:688343,以下简称云天励飞)签订了数据服务合作协议。公司以数据推送服务方式为云天励飞提供近两年广东省政务网站(非全量)新闻、公文、公告、政策类数据数百万条,作为其大模型预训练数据集。大模型训练需要优质且合法的中文数据资源,而网信办、具备新闻发布资质的单位以及其他组织机构所发布的合法稿源、长期数据,无疑具备稀缺性。目前,公司拥有规模位列业界前茅的权威高质量公开数据1500亿+,涵盖近10年来的报刊数据、互联网主流新闻数据、新闻资讯客户端数据、政府类门户网站数据、权威第三方平台数据及行业资讯数据等。公司正积极与多家大模型头部厂商洽谈数据服务合作业务。未来,公司有望为全国更多MaaS服务商提供不同垂直领域的高质量预训练数据服务。
3、受宏观环境变化及政府预算紧张的影响,公司的政务行业营收水平和利润贡献较上年同期有所下降。
2023年3月,公司数字经济研究院编写的《拓尔思数据要素》(以下简称《》)正式对外发布。《》基于拓尔思数据要素业务的实践,从我国数据要素市场发展背景到拓尔思数据要素业务发展历程、业务目标、商业模式、业务体系、数据资产、数据和云服务、市场规模、发展方向等层面进行了全面介绍。《》重点介绍了公司以做大做强数据要素业务为发展目标,通过充分发挥海量数据规模和丰富应用场景优势,在经营过程中形成了一套“1+1=N”的商业模式,即基于自研的大数据底座和人工智能底座,以场景驱动推出N个行业数据和云服务。目前,该模式已在政务、金融、媒体、舆情、安全、专利等行业或领域获得了成功实践。
报告期内,公司与知识产权出版社进行合作,在强化搜索引擎技术与数据资源优势基础上,重磅推出完全自主可控的“拓知全球基因专利数据库”(以下简称拓知基因)。拓知基因目前涵盖全球40多个国家BOB半岛·(中国)官方网站、地区和组织的生物序列相关专利数据及32个公共资源库,包含4.2亿条专利基因序列及11.9亿条公共资源生物序列。系统支持生物序列检索、序列比对、基因专利检索等丰富检索策略,提供多途径检索追溯、分析手段和辅助工具,以及检索分析报告的查看和下载,并对基因序列和专利进行深加工,在支持基因序列融合检索基础上,支持度揭示基因专利等功能。拓知基因在性能优势上具备数据范围广、检索策略丰富、系统功能强和图形展示更直观四大特点。典型应用场景包括纳米生物技术、组织工程与再生、基因测序、基于细胞的检测、发酵工程、PCR技术、色谱技术、生物医药的研发、基因治疗和诊断、食品保健、农业育种、自然资源与环境、工业加工、生物信息学等多个领域。
3、公司产品完成中国信通院对线月,公司自主研发的TRS小思智能问答机器人系统参与中国信通院首轮对话式AI专项评测工作,并顺利通过对话功能模块评测。此次评测,依据《对话式人工智能技术及产品评估方法》开展,共涉及8项指标,评估对话式AI产品的功能完备度。TRS小思智能问答机器人系统的功能完备度较高,全面支持用户私有资源定制、知识库管理、第三方数据接入功能,支持对话干预、对话引导、多媒体消息交互,具备较好的情绪安抚和格式解析能力。
2023年5月10日,在中国信通院组织的首批可信数据库“搜索型数据库”产品能力评测中,公司“TRS海贝搜索数据库”系统顺利完成了搜索型数据库产品能力评测。本次评测依据《搜索型数据库技术要求》,覆盖数据库基本能力、数据库管理能力、数据库安全能力、数据库兼容能力、数据库扩展能力、数据库高可用能力,共计32个测试项目,包括12个必选项和20个可选项。“海贝搜索数据库”是公司自主研发的一款搜索引擎数据库,适用于数字、文本、地理位置、结构化数据、非结构化数据等所有数据类型,为大数据应用提供高效的数据存储、全文检索、分析统计等数据管理服务。
在2023年5月举办的2023中关村论坛上,公司正式对外发布海贝搜索数据库V10和数星产业大脑两款产品。
本次最新发布的海贝搜索数据库V10,在数据存储和数据检索等方面的性能实现了大幅提升。海贝不仅提供了更加专业的段句位检索、XML检索以及度量衡数据的数值区间检索等高级功能,新增向量检索功能(支持语义/图像/多模态搜索),让数据检索更加精确;同时,海贝还加强了数据安全控制,通过用户管理、权限控制、安全审计以及索引加密等机制,保证用户数据的安全可靠。海贝目前已经服务于安全大数据、媒体大数据、政府大数据以及军队大数据等众多细分行业,拥有、新华社、国家市场监督管理总局、海关总署、专利局、商标局等一系列客户,具有众多国家标杆项目成功经验以及本土化服务能力,可作为国外开源软件ElasticSearch的国产替代。在国家层面,几个重大的基础数据库,例如企业信用信息公示系统、专利检索系统等都构建在海贝之上。依托海贝构建的浙江日报报业集团“媒立方”,实现了多种媒介的有机融合、新闻数据的流程再造,荣获王选新闻科学技术奖特等奖。目前海贝已完成与龙芯、海光、飞腾、鲲鹏等国产芯片以及中标麒麟、统信UOS等国产操作系统的适配工作,完全满足信创要求和国产化替换需求。
数星产业大脑是一款基于自然语言处理、大模型等语义智能技术的智能信息服务平台,它能够融合海量另类数据,以产业视角透视风险与机会,洞察产业态势,监测企业风险,获取企业商机。数星产业大脑可满足金融、政府和企业等机构获取、加工、处理另类数据应用于决策的需求,让信息发现从“人工模式”进入“智能模式”。该平台提供产业链中心、宏观洞察、产业地图、产业拓客、事件中心、研究中心、企业洞察七大应用功能,支撑跨场景赋能,助力实现产业高质量发展。平台具备多层次、多形式的服务体系,不仅可提供对外标准化的SaaS化服务,还面向场景端形成智能风控、科创营销、精准招商及电报小程序四大场景,能够满足用户本地化、模型定制以及产品定制化的多元诉求。数星产业大脑已在全国多个场景应用,覆盖信用、风控、监管、招商等多个商业化应用领域,为国有银行、政策性银行及50%的股份制商业银行等金融行业用户提供一整套风险监控解决方案,为北京经开区、营口、成都等区域的政府精准招商赋能,构建全面产业分析、提供强链补链策略等等。
报告期内,基于在NLP领域30年技术创新成果、10余年高质量数据和知识资产积累,以及在垂直行业10000多家企业级用户应用实践,公司隆重发布“拓天大模型”,并面向媒体、金融、政务领域,推出了三大行业大模型。
和通用大模型相比,拓尔思“拓天大模型”基于多年自主研发成果,在自主可控、中文特性加强、专业知识加强、实时数据接入、内容安全和价值观对齐、客户私有化部署等方面具有领先优势,并与业务场景深度融合,为用户带来生产力变革。
“拓天大模型”拥有内容生成、多轮对话、语义理解、跨模态交互、知识型搜索、逻辑推理、安全合规、数学计算、编程能力和插件扩展十大基础能力,具有中文特性增强的可控生成技术、融合搜索引擎的生成结果可信核查、融合稠密向量的跨模态能力加强以及支持外界知识及时更新四大创新点。
公司以三大行业大模型作为产业落地的先行突破:拓天媒体大模型,具有内容生产智能助手、新一代搜索与推荐、多模态传播与服务三大行业应用;拓天金融大模型,已在投研服务、信贷风控、审查审批、客户服务等场景助力用户实现智能化转型;拓天政务大模型,在公文辅助写作、政务咨询、政策服务、接诉即办、智能工作助手等场景提高用户办公效率,提升政务服务质量。2023年下半年,公司计划推出网络舆情、公安、知识产权、法律、审计等行业大模型。
凭借深厚的技术实力与丰富的数智化应用场景,报告期内,拓尔思赢得了众多奖项和荣誉:荣获2022大数据产业年度创新服务企业、2023爱分析-信创产品及服务创新奖、中国优秀软件产品(网察大数据分析平台/海贝大数据管理系统)等。公司自主研发的TRS小思智能问答机器人和TRS海贝搜索数据库分别通过中国信通院对话式AI首轮专项评测和搜索型数据库产品评测。