一、本公司董事会、监事会及董事、监事、高级管理人员保证年度报告内容的真实性、准确性、完整性,不存在虚假记载、误导性陈述或重大遗漏,并承担个别和连带的法律责任。
公司已在本报告中详细描述可能存在的风险,敬请查阅“第三节管理层讨论与分析”(之四)“风险因素”部分,请投资者注意投资风险。
五、容诚会计师事务所(特殊普通合伙)为本公司出具了标准无保留意见的审计报告。
六、公司负责人贺琳、主管会计工作负责人吕思遥及会计机构负责人(会计主管人员)王超声明:保证年度报告中财务报告的真实、准确、完整。
七、董事会决议通过的本报告期利润分配预案或公积金转增股本预案经公司第三届董事会第四次会议审议,公司拟定2024年度利润分配预案如下:拟以实施权益分派股权登记日登记的总股本扣除回购专户股份后的股本为基数分配利润,向全体股东每10股派发现金股利3.50元(含税),截至2025年3月31日,公司总股本60,325,180股,回购专户股份数466,117股,以此计算合计拟分派现金红利20,950,672.05元(含税);根据《上市公司股份回购规则》等有关法律法规,上市公司以现金为对价,采用要约方式、集中竞价方式回购股份的,视同上市公司现金分红,纳入现金分红的相关比例计算。公司在2024年度以集中竞价交易方式累计回购906,014股,支付的资金总额为人民币49,987,510.15元(不含印花税、交易佣金等交易费用),视同现金分红。综上,公司2024年度现金分红总额为70,938,182.20元(含税),现金分红比例为625.77%;2024年度不进行资本公积转增股本,不送红股。
2024年度利润分配预案披露后至实施权益分派的股权登记日期间,若公司总股本发生变动,公司拟维持每股现金分红金额不变,相应调整现金分红总额。
本报告中所涉及的未来计划、发展的策略等前瞻性陈述,不构成本公司对投入资产的人的承诺,敬请投资者注意投资风险。
十二、 是不是真的存在半数以上董事没办法保证公司所披露年度报告的真实性、准确性和完整性否
北京创世联合投资管理有限公司,为北京中瑞安企业 管理中心(有限合伙)普通合伙人、执行事务合伙人
数安易(北京)科技有限公司,为公司对外投资的一 家公司,其主要是做数据安全有关技术及产品服务, 在数据脱敏、数据加密、数据资产管理平台、数据安 全治理等方面的能力,可为海天瑞声数据业务的合规 开展提供重要技术支撑。
AppenLimited,是一家成立于澳大利亚的训练数据 产品和服务提供商
标贝(北京)科技有限公司,是一家国内同行业的训 练数据产品和服务提供商
通过采集与处理等步骤形成的、结构化的、可供人工 智能算法模型训练使用的数据
解题方案的准确而完整的描述,是一系列处理问题的 清晰指令,算法代表着用系统的方法描述解决实际问题的 策略机制
ArtificialIntelligence,是研究、开发用于模拟、 延伸和扩展人的智能的理论、方法、技术及应用系统 的一门技术科学
MachineLearning,是一门专门研究计算机模拟或实 现人类的学习行为,以获取新的知识或技能,重新组 织已有的知识结构使之不断改善自身性能的学科
DeepLearning,机器学习研究中的一个新的领域, 其动机在于建立、模拟人脑做多元化的分析学习的神经网 络,它模仿人脑的机制来解释数据,例如图像、声音 和文本
为解决AI领域的相应问题,而专门设计的某种 算法框架,并通过大量数据训练拟合来调整相应参 数,最终得到能解决实际问题的一套算法和参数
鲁棒性亦称稳健性、强健性,是指计算机软件/系统 在异常和危险情况下生存的能力。例如,计算机软件 在输入错误、磁盘故障、网络过载或有意攻击情况下, 能否不死机、不崩溃,就是该软件的鲁棒性
实现人机语言的通信,包括语音识别技术(ASR)和 语音合成技术(TTS)
AutomaticSpeechRecognition,是一种将语音信号 自动转换为文本的技术,是实现智能人机交互的关键 技术之一
TexttoSpeech,即“从文本到语音”,是一种将文 字智能地转化为自然语音的技术
NaturalLanguageProcessing,是计算机科学领域 和AI领域中的一个重要方向,研究能实现人与 计算机之间用自然语言进行相对有效通信的各种理论和 方法
ComputerVision,是一门研究怎么样使机器“看”的 科学,是指用摄影机和电脑代替人眼对目标进行识 别、跟踪和测量等
是指电子设备(例如扫描仪或数码相机)检查纸上打 印的字符,通过检验测试暗、亮的模式确定其形状,然后 用字符识别方法将形状翻译成计算机文字的过程
物联网(IoT,Internetofthings)即“万物相连 的互联网”,是网络基础上的延伸和扩展的网络, 将各种信息传感设备与网络结合起来而形成的一个 巨大网络,实现任何时间、任何地点,人、机、物的 互联互通
虚拟人(VirtualHuman)是通过建模、动作捕捉或 AI等科学技术手段,制作出具有外貌特征和行为模式的 虚拟形象,并通过显示设备呈现出来。虚拟人创造的 价值主要是打破物理的空间限制,提供了更多沉浸 感、参与感和互动感
使用软件工具、录音设备、图像拍摄设备等收集、录 制和获取原料数据的过程
训练数据的生产步骤之一,指对原料数据来进行加工, 进而生成符合算法模型训练要求的训练数据的过程
AIGeneratedContent,又叫生成式人工智能,是指 是使用机器学习和深度学习算法,从现有数据中学习 并生成新内容的一种人工智能技术。它可以生成各种 形式的数据,如图像、音频、视频和文本,并在虚拟 现实、自然语言处理、艺术创作和模拟实验等领域有 广泛应用
美国人工智能研究公司OpenAI发布的可以实时进行 音频、视觉和文本推理的大模型
是幻方量化旗下AI公司深度求索(DeepSeek)研发 的推理模型,DeepSeek-R1采用强化学习进行后训练, 旨在提升推理能力,尤其擅长数学、代码和自然语言 推理等复杂任务
大模型就是FoundationModel(基础模型),指通 过在大规模宽泛的数据上进行训练后能适应一系列 下游任务的模型
多模态机器学习(Multi-modalMachineLearning) 是一种机器学习方法,用于处理多种类型的数据,如 图像、文本、音频等。它通过将来自不同模态的数据 进行整合和联合建模,以提取和学习不同模态之间的 相关信息和特征。多模态数据是指用于多模态机器学 习训练使用的跨形态数据类型
思维链(ChainofThought,简称CoT),是指把逻辑 较为复杂的问题进行拆解,通过一系列有逻辑关系的 思考,形成完整的思考的过程
大模型预训练第一性原理,也是在机器学习领域,特 别是对于大型语言模型而言,模型性能与其规模(如 参数数量)、训练数据集大小以及用于训练的计算资 源之间存在的一种可预测的关系。这种关系通常表现 为随着这些因素的增长,模型性能会按照一定的幂律 进行改善
有动思考和行动的智能体,能够以类似人类的 方式工作,通过大模型来“理解”用户需求,主动“规 划”以达成目标,使用各种“工具”来完成任务,并 最终“行动”执行这些任务
人工智能与机器人学交叉的前沿领域,强调智能体通 过身体与环境的动态交互实现自主学习和进化,其核 心在于将感知、行动与认知深度融合
OccupancyNetworking技术,在自动驾驶感知领域 中,主要指的是利用传感器数据构建三维空间中的占 用网络,以表示周围环境中的物体和空间状态
Birds-Eye-View,即鸟瞰视图,是一种从上方观察 对象或场景的技术
注:本年度报告除特别说明外若出现总数和各分项数值之和尾数不符的情况,均为四舍五入原因造成。
(1)报告期内,公司营业收入为2.37亿元,较去年同期增长39.45%,主要系受益于大模型技术的快速发展以及应用场景不断落地,以智能终端厂商、科技互联网公司等为代表的国内外科技巨头纷纷加大多模态数据投入以支撑其智能终端、内容生成等领域的AI能力建设所致。在此背景下,以多语种、多音色等为代表的智能语音业务需求、以及以指令微调、偏好对齐等为代表的自然语言业务需求同比均呈现大幅增长,整体上驱动公司营业收入同比显著增加。
(2)报告期内,归属于上市公司股东的净利润、扣非净利润分别为1,133.61万元、497.35万元,较去年同期增加4,172.13万元、4,844.42万元,主要系营业收入大幅增长的同时,具有高毛利特点的数据集产品收入占比以及定制服务毛利率提升,驱动公司整体毛利率增加所致。此外,应收账款减值减少导致信用减值损失同比下降。以上因素共同驱动2024年度归属于母公司所有者的净利润、归属于母公司所有者的扣除非经常性损益的净利润由亏转盈,同比实现显著增长。
(3)报告期内,经营活动产生的现金流量净额为2,873.34万元,较去年同期增加5,977.96万元,主要系报告期内收入整体增长较为明显、客户回款同比增加所致。
(4)报告期内,基本每股收益、稀释每股收益均为0.19元/股,较去年同期增加0.69元/股,主要系归属于母公司所有者的净利润相比同期大幅增长所致。
(5)报告期内,扣除非经常性损益后的基本每股收益为0.08元/股,较去年同期增加0.80元/股,主要系归属于上市公司股东的扣除非经常性损益的净利润相比同期大幅增加所致。
(一)同时按照国际会计准则与按中国会计准则披露的财务报告中净利润和归属于上市公司股东的净资产差异情况
(二)同时按照境外会计准则与按中国会计准则披露的财务报告中净利润和归属于上市公司股东的净资产差异情况
计入当期损益的政府补助,但与公 司正常经营业务密切相关、符合国 家政策规定、按照确定的标准享 有、对公司损益产生持续影响的政 府补助除外
除同公司正常经营业务相关的有 效套期保值业务外,非金融企业持 有金融资产和金融负债产生的公 允价值变动损益以及处置金融资 产和金融负债产生的损益
主要系公 司为提高 资金使用 效益,购 买银行保 本浮动收 益型理财 产品取得 的投资收 益。
企业取得子公司、联营企业及合营 企业的投资成本小于取得投资时 应享有被投资单位可辨认净资产 公允价值产生的收益
对于现金结算的股份支付,在可行 权日之后,应付职工薪酬的公允价 值变动产生的损益
对公司将《公开发行证券的公司信息披露解释性公告第1号——非经常性损益》未列举的项目认定为非经常性损益项目且金额重大的,以及将《公开发行证券的公司信息披露解释性公告第1号——非经常性损益》中列举的非经常性损益项目界定为经常性损益的项目,应说明原因。
公司部分信息涉及商业秘密,根据《上海证券交易所科创板股票上市规则》《上海证券交易所科创板上市公司自律监管指引第1号——规范运作》的相关规定,公司已按照《信息披露暂缓与豁免业务管理制度》完成相应的审批程序。
2024年,受益于多模态大模型的快速发展以及“AI+”在应用端的进一步落地,全球训练数据需求快速增长。一方面,大模型语音交互需求持续攀升,公司凭借多年在语音数据方面的积累,获得以智能终端厂商、科技互联网公司等为代表的国内外科技巨头多类语音数据订单,带动大模型相关业务收入快速增加,并成为公司收入增长的核心引擎。另一方面,为更好拥抱新一轮全球化市场机遇,公司持续加大海外市场拓展力度,丰富品牌营销策略、推动销售提速,并通过建设海外交付能力完善海外供应链体系,启动海外全链条服务能力的延展,进一步带动境外业务收入显著复苏。此外,公司不断拓展智能驾驶服务能力边界,抢抓车企出海机遇,积极探索布局境外数据采集业务;同时继续保持有竞争力的研发投入,持续优化迭代智能驾驶数据处理相关算法研发和平台建设,以及智能化标注能力数据服务能力逐步延伸至4D数据标注、大点云分割等更复杂场景,以更好适应以BEV技术为主、稳步向OCC技术方向探索的高阶智能驾驶技术需求。受上述各项积极因素带动,公司整体营业收入实现同比增长。
此外,由于标准化数据集产品收入占比大幅提升,同时公司整体数据交付能力在管理能力优化、平台技术提升、供应链进一步整合和扩展等因素的共同推动下,使训练数据定制服务的毛利率也同比显著增长,共同驱动公司整体毛利率增加至66.46%。此外,应收账款减值减少导致信用减值损失同比下降。以上因素共同驱动公司全年净利润大幅增长,实现扭亏为盈。
报告期内,公司实现营业收入2.37亿元,较上年同期增长39.45%;归属于母公司所有者的净利润1,133.61万元,较上年同期增加4,172.13万元;归属于母公司所有者的扣除非经常性损益的净利润为497.35万元,较上年同期增加4,844.42万元;经营性现金流净额2,873.34万元,较上年同期增加5,977.96万元。截至报告期末,公司总资产为8.08亿元,归属于母公司的所有者权益为7.43亿元,分别较期初减少1.95%和4.99%。2024年公司具体经营情况如下:(一)核心业务板块经营情况
2024年,受益于大模型技术的快速发展以及应用领域不断拓展,以智能终端厂商为代表的科技巨头纷纷加大多模态数据投入,全球数据服务市场持续增长。在此背景下,公司凭借多年在语言研究方面的技术积累、以及全球领先的标准化数据集产品储备,进一步赢得了境外客户信赖。
与此同时,《促进和规范数据跨境流动规定》等法规出台,为数据出境提供了更为高效简明的路径。得益于行业发展以及政策环境的改善,截至报告期末,公司境外业务收入较上年同期显著增长89.53%至1.14亿元。
此外,为更好把握行业机遇、进一步扩大全球客户辐射范围,公司从体系搭建、市场研究、品牌升级、营销推广等多维度提升业务、客户触达及服务能力。报告期内,公司持续加强境外销售团队建设,进一步织密客户服务网络;同时,通过参与包括WebSummitQatar、ICASSP、AIEXPOTOKYO、AutosenseandInCabin、CVPR、ACL、Interspeech、SLT及NeurlPS等全球知名行业及AI学术顶会,以及布局搜索广告投放、社交媒体矩阵等多类宣传渠道等方式,向全球市场展示公司先进技术实力及创新产品,提升行业影响力和美誉度。2024年公司获得由AcquisitionInternationalMagazine颁发的BestAI-PoweredDataSolutionsCompany奖项和Datarade颁发的TopAITrainingDataProvider奖项。截至报告期末,公司境外客户数量已超过260家。
报告期内,公司通过在新加坡投资设立控股公司的方式拓展海外首个自主可控的数据交付基地,在订单、产能两端同步实现增量覆盖,不仅有助于培育新的营收增长点,更为下一步提升海外定制化业务能力奠定基础。
伴随大模型技术的不断突破,人工智能行业被按下发展“快进键”,数据作为大模型的“燃料”,已成为模型公司打造差异化优势的战略性资源,高质量数据需求快速增加。报告期内,公司不断拓展自身大模型数据服务能力,从预训练、后训练、到指令微调、对齐、评测等全链条环节为客户提供立体支撑;同时,也逐渐从通用的基座模型的数据服务,拓展至艺术、工业、教育、医疗等多类垂直领域;服务的客户范围也已覆盖至主要大模型厂商和研究机构。报告期内,公司持续加大大模型数据方向的研发投入,增厚大模型领域的数据储备,新增开发了多类多语种、多音色、多情感、多场景的ASR和TTS语音数据集;以及服务视觉理解以及视觉生成的视觉数据集;同时,前瞻性建设了用于提升大模型推理能力的CoT数据集,通过详细的推理步骤注释,让大模型学习从问题到答案的逻辑推导过程,有效填补传统数据集缺乏推理结构的空白。与此同时,为更好理解大模型技术方向,报告期内,公司通过前瞻性研究,探索大模型数据的规模化生产方式,全面助力公司大模型业务的扩张。公司已和清华大学联合启动多语种语音大模型研发计划,该项目将基于最新的E-Branchformer、CTC-Attention技术,自研东方40语种、以及中国22方言数据清洗技术,训练了0.1B-1.7B等4个不同规模的语音大模型,模型效果达到了业界同等尺寸的领先水平。公司的算法团队联合清华大学语音与音频技术实验室充分利用公司海量高质量语音数据集储备,充分发挥各自所长,促进大模型技术在数据生产领域的更深层次的应用。
2024年,为更好抢抓智能驾驶行业机遇,同时应对更为复杂的数据处理需求,公司加大了对高级别数据标注工具的研发力度,截至报告期末,DOTS-AD平台新增3D动静分离标注工具,BEV多图层4D车道线标注工具,并升级点云分割工具支持连续帧叠加标注和大点云分段加载、点云区域分割等核心能力,有效支撑了自动驾驶BEV和OCC主流算法演进对数据标注工具的需求。此外,公司不断优化算法中台中枢能力,开发了2D&3D融合的动静分离检测追踪算法,在点云连续帧融合产线%以上;迭代优化点云分割算法和地面检测算法,在点云分割产线D点云预刷式跟踪技术、4D点云重建技术,均取得了20%以上的提效成果。
此外,为进一步支撑我国车企的国际化战略,公司在全球范围内扩展了道路采集业务,可提供包括采集方案设计、采集人员组织、车队管理、车辆改装及数据清洗与脱敏等在内的全链条服务。截至报告期末,公司采集业务已覆盖包括德国、西班牙、捷克等多个国家,为公司构建智能驾驶全球化数据服务能力奠定了基础。同时,舱内支撑DMS和OMS研发需求的采集业务也已拓展至俄罗斯、奥地利等多个欧洲国家,为众多客户出海业务提供有力数据支持。
2024年,按照技术+产品双轮驱动的定位,公司继续保持有竞争力的研发投入强度,不断提升技术和平台工具先进性、在大模型数据处理技术方向进行积极探索储备、巩固标准化数据集产品储备、增厚语音语言学基础研究领先性,持续巩固公司核心竞争力。报告期内,公司研发费用共计6,343.91万元,占当期营业收入的26.76%。截至报告期末,公司研发人员数量79人。
报告期内,公司持续加大基础研发投入,进一步提升人工智能基础算法、一体化数据处理平台、前沿技术研发等领域能力;在智能驾驶数据处理综合性平台上继续提升自动化能力,并落地更多面向智能驾驶数据预处理的相关算法;同时,在面向大模型预训练、后训练、微调、对齐及评测技术上持续保持技术探索、储备,推动相关领域的数据服务,并形成了一些代表性成果:1.1算法
智能语音领域,完成Whisper推理框架升级、显存占用降低59%、推理延迟降低59%,新增ASR模型11个、语音识别算法支持语种数增至130+个,大幅提升了算法在实际项目中的降本增效能力。在计算机视觉领域,引入Detzero-track、CenterPoint、Lane-Marking-Detection、FaceFusion、roop、Ultralytics、BoT-SORT等有代表性的计算机视觉框架或算法,上线D点云目标检测多模型融合算法、4D大点云车道线检测算法、GDINO-零样本目标检测等算法,优化2D细分类视频跟踪算法、2D异形红绿灯跟踪算法、4D车道线长度动态自适应调整算法等多个智能驾驶场景下的模型,并新增超过27种不同场景的视觉类算法预处理技术。在大模型算法领域,针对公司自有知识产权的语音数据集,设计通用的数据清洗、模型训练、模型评测框架,已完成数据清洗pipeline搭建,并初步清洗出通用格式的语音数据数十万小时,同时完成语音大模型训练所需要的算力集群搭建、算法框架研发、模型训练pipeline搭建、并完成东方语种语音大模型的训练、微调、评测等。针对视觉大模型应用领域,构建起基于特征向量的去重技术、美学评分模型、图文生成模型等多个基础能力,并在项目中投入应用,取得了良好的降本效果。
公司在训练数据生产与管理的一体化平台建设方向精耕细作,展现了一系列创新成果,具体可归结为以下核心维度:
(1)重点推进以数据为核心的一体化平台体系建设,通过集中研发DataX数据中台,优化整合原有数据存储、数据可视化和数据流转等功能,全面提升一体化数据处理平台的处理过程柔性管理能力,数据处理管道新增可视化编排工具,集成20+新型算子,实现了十余类核心预处理算法模型自动化对接、数据切片、数据加工处理管道的快速搭建与灵活编排,以及数据处理算子集成与统一管理,共计近60个功能点。
(2)实现贯穿数据采标、模型训练、模型效果展示全生命周期管理:重点优化多源多模态非结构化与结构化数据的标准化与一致性管理,以及点云与图像类算法模型对比与模型评测支撑能力。深度集成预处理算法库,算法评测体系扩展至15+量化指标,支持多模型对比测试与算法结果可视化展示,扩展模型版本效果量化对比展示及分析能力等超60个功能点,大幅提升公司对训练数据的一站式全生命周期管理能力,形成从数据管理到模型迭代的完整算法增强闭环。
(3)积极投入人工智能数据运营平台的全链路智能化体系革新,重点建设数据共建共享机制、全面升级多模态AI标注算法矩阵、有效优化分级流通合规保障体系等核心功能,创新研发自动化标注工具集群,搭建覆盖开源开放、成员共建、可信空间的三级数据生态,形成覆盖文本、语音、图像、视频的智能化处理矩阵。同时,逐步建设形成从资质认证、脱敏加密到合规审计的全流程安全管控体系,强化跨平台数据流动追溯与多角色协同能力,构筑起集数据汇聚、生产、治理、流通、应用于一体的智能化基础设施平台,推动数据要素市场基础设施向智能化、合规化、生态化方向加速演进。
通过上述投入,截至报告期末,公司共获得专利授权41项,获得登记的软件著作权180项。
同时,公司实质性地提升了自身的数据全生命周期管理与运营能力、算法能力、工程化数据研发及生产能力,形成了更为合理、高效的人机协同智能化解决方案,持续降低训练数据开发成本,以AI赋能训练数据开发,以训练数据驱动AI产业发展。
标准化数据集产品,是公司区别于众多竞争对手以定制化服务为主的特有商业模式,也是公司核心竞争力之一,标准化产品是公司基于未来行业需求的研判,在市场需求出现之前,预先开发的数据集,具有即用即取的特点,可帮助客户大幅缩短模型研发周期并有效降低数据投入成本。
同时,由于产品本身的知识产权由公司享有,具有一次性研发生产、可重复多次销售的特点,因此可更好帮助公司实现未来可持续性销售、以及毛利空间提升。
因此,为更好适应行业发展需求,公司2024年在产品研发方面持续投入,用于开发覆盖智能语音、计算机视觉以及自然语言等传统深度学习以及大模型领域的相关数据集产品。截止报告期末,公司新增研发超150个训练数据集产品,自有知识产权的训练数据产品储备超过1,700个,尤其在多语种及多音色语音数据集和发音词典、动作捕捉等多模态数据集、以及多语种OCR和手写体数据集等方面积累了更丰富的标准化产品资源,并建成包括“大语言模型中文对话预训练数据集”、“语音大模型(声音复刻、歌曲)预训练及微调数据集”、“视觉大模型(图像-文本)预训练及微调数据集”等在内的多领域大模型数据集。截止报告期末,公司标准化数据集产品储备情况如下:
个人助手、语音输入、智能家居、智 能客服、机器人、语音导航、智能播 报、语音翻译、移动社交、虚拟人、 智慧金融等
智能驾驶、移动社交、虚拟人、智慧 金融、智慧交通、智慧城市、OCR识 别等
截止报告期末,公司已向下游客户提供了累计超过9,500次/个定制或标准化训练数据集,并已应用于个人助手、语音输入、内容生成、智能家居、机器人、语音导航、智能客服、智能播报、语音翻译、移动社交、虚拟人、智能驾驶、智慧医疗、智慧教育、智慧交通、智慧城市、智慧金融、机器翻译、智能问答、信息提取、情感分析、OCR识别等22类创新应用领域,赋能人工智能技术与实体经济的深度融合。
随着全球化扩张成为头部AI企业收入增长的重要引擎,多语种数据的作用和价值更加凸显。
为更好满足客户多语种拓展需求,公司持续保持语音语言学研究力度,在语音语言学基础研究方面,公司不断丰富合作语言学家团队资源,成员遍布世界各地的学校及研究机构,在语音语言学领域具备丰富经验和技术储备。截止报告期末,公司已经拥有超过205个语种/方言的覆盖能力,不仅包括含英、法、德、意、西、日、韩等常见语种,还包括东南亚、一带一路等国家地区的罕见小语种,尤其在亚洲小语种、中东欧小语种的服务上具备竞争优势。同时,公司建立了成熟的发音词典构建流程,公司已积累下近140个多语种的发音词典,覆盖波斯尼亚语、塞尔维亚语、巽他语、尼泊尔语、奥利亚语、基隆迪语、茨瓦纳语、达利语等小语种,累计词条数超过1,200万条,可支撑构建高质量的智能语音、以及多模态训练数据,是公司的主要竞争壁垒及核心技术之一。
2024年,中央和地方出台了一系列有关数据要素、数字经济的法律法规和政策,同时,《促进和规范数据跨境流动规定》等法规出台,都对企业的数据安全水准和能力提出了更高要求,也为企业在数据要素、人工智能等领域的发展提供了新的机遇。
公司一直以来非常重视数据安全管理以及相关能力的提升,并将其作为把握新发展机遇所必须练好的“基本功”。2024年,公司在数据安全方面取得了多项工作成果。公司“AIGC训练数据业务的综合合规管理机制”案例荣获中国互联网协会首届“金灵光杯”中国互联网创新大赛企业合规赛道优秀奖。公司积极参与行业发展,提出立法建议、参与行业调研,数据安全能力获得广泛认可。
公司也一直坚持统筹安全与发展并重的原则,在守住安全合规底线的前提下积极拓展包括数据跨境流通在内的数据要素业务。
2024年,在AI大模型技术快速迭代的驱动下,公司战略布局医疗、金融、法律、艺术等垂直领域,深度整合产学研资源,通过与各行业的专业机构及专家的合作成功构建了覆盖诊断、智能投顾、合规风控、数字版权等细分场景的供应链资源池,不仅提升了供应链体系的响应敏捷度与行业适配性,更通过知识图谱与区块链技术的融合应用,实现了跨领域资源的智能匹配与全流程可信溯源,显著增强了供应链生态的多样性与专业壁垒。
在战略供应商生态构建方面,公司深度践行“共生共赢”理念,与战略供应商建立了长期稳定的合作关系,加强了与供应商的风险共担机制,共同应对市场波动和不确定性。
公司也进一步优化了供应链网络,特别是在海外一手资源群体的扩展方面取得了重要进展。
通过建设大型数据基地及精细化管理资源池,供应链的多样性和稳定性得到了显著提升,为实现可持续性产能扩张和成本优化奠定了坚实基础。
在供应链管理体系建设方面,通过建立更细致的成本核算模型和流程监控节点,实现了对供应链各环节成本和效率的精准把控。同时,全面升级线上管理系统,实现了订单处理、资源配置和结算审批的一体化和实时化。
报告期内,公司完成销售、生产、研发体系的绩效管理机制优化,并对内部反馈机制及奖金核算机制进行迭代,以期增强绩效牵引力实现更加公平和富于激励性的管理效果。上半年公司组织多种类专项培训及人才发展项目,在大模型领域的探索与应用进行广泛深入的内部交流,组织销售、生产、职能等多体系的软技能培训,对应届高潜毕业生、新锐力量、中坚力量、中高层管理人员采取不同的梯队建设规划,以保障人才队伍的不断夯实。文化建设方面,强化高度敬业和持续创新文化,进行榜样之星等多样化的文化倡导和活动辐射,打造更加尊重信赖和追求卓越的组织基因。同时在人才引进方面,启动海外人才招募、研发专项人才和高潜毕业生吸引计划,引入多名欧美同业专家、优质研发人员、及卓越背景应届毕业生,充实销售、研发及项目交付队伍的人才密度,发展健康、可持续、多元化的人才队伍。
二、报告期内公司所从事的主要业务、经营模式、行业情况及研发情况说明 (一)主要业务、主要产品或服务情况 1. 主要业务情况 公司主要从事AI训练数据的研发设计、生产及销售业务。公司通过设计数据集结构、组织数 据采集、对取得的原料数据来加工,最终形成可供AI算法模型训练使用的专业数据集,通过软 件形式向客户交付。 自2005年成立以来,公司始终致力于为AI产业链上的各类机构提供算法模型开发训练所需 的专业数据集。经过多年发展,公司已成为人工智能基础数据服务领域具有较强国际竞争力的国 内头部企业,并实现了标准化产品、定制化服务、相关应用服务全覆盖。公司所提供的训练数据 涵盖智能语音(语音识别、语音合成等)、计算机视觉、自然语言等多个核心领域,全面服务于 人机交互、智能家居、智能驾驶、智慧金融、智能安防等多种创新应用场景。 公司的产品和服务已获得阿里巴巴、腾讯、百度、科大讯飞、海康威视、字节跳动、微软、 亚马逊、三星、中国科学院、清华大学等国内外客户的认可,应用于其研发的个人助手、智能音 箱、语音导航、内容生成、搜索服务、短视频、虚拟人、智能驾驶、机器翻译等多种产品相关的 算法模型训练过程中。目前公司客户累计数量超过1,050家,覆盖了科技互联网、社交、IoT、智 能驾驶、大模型等领域的主流企业,以及政企、教育科研机构。图:公司产品服务矩阵示意
公司研发、生产的训练数据覆盖了智能语音、计算机视觉及自然语言处理三大AI核心领域,广泛应用于算法模型的开发、训练、优化、应用场景拓展等环节。此外,公司还提供与训练数据相关的应用服务。
语音识别(AutomaticSpeechRecognition,ASR)是让机器能够“听懂”人类语音的技术,它能使机器自动将语音信号转换为对应的文本信息。
语音合成(TexttoSpeech,TTS)是让机器能够“说出”人类语音的技术,它使机器能将文字信息转化为流畅的语音“朗读”出来,相当于给机器安上了人工嘴巴。
以日常生活中的情景为例,语音输入法、即时通讯软件运用了语音识别技术将用户输入的语音实时转换为文字,实现了软件“听懂”语音并“听写”出文字的效果;而地图、导航软件则运用语音合成技术,实现了软件“发声说话”的效果,为用户提供即时语音导航。
公司通过设计(设计训练数据集结构、供发音人朗读录制的语料文本或对话场景、发音人分布、录音设备场景等)、采集(定义合适的发音人、选取录音设备及软件、组织发音人朗读录制音频)、加工(对音频文件进行切分、标注各类声音特征,形成带时间戳和特征标签的文本和标注文件等)、质检(对数据集进行质量检测,如音字一致性、标注准确率检查等)等训练数据集生产环节;或者针对客户提供的原料音频文件执行加工、质检工作,最终形成客户所需的智能语音训练数据集。
计算机视觉(ComputerVision,CV)是使机器具备“看”的功能的技术,它使得智能驾驶、智能家居、手机、安防设备等机器能够代替人眼对目标进行识别、跟踪和测量等。
以日常生活中的情景为例,在汽车的自动驾驶功能中,计算机视觉技术使得汽车能够“看见”并识别行车过程中的各种行人、路况场景,为后续作出相应的反应奠定基础;在机场、车站安检中,计算机视觉技术使得人脸识别设备能够识别被检验人员是否为其出示的身份证件显示的人员。
公司通过设计训练数据集结构、采集(如定义合适的人脸、动作、场景作为采集对象,组织被采集人按照要求拍摄照片、录制视频等)、加工(对图像、视频文件进行打点、拉框、分割标注等)、质检(对数据集进行质量检测,如检验图片、视频文件格式是否正确,检查光照环境、物体种类的数量是否达标,打点标框的准确率是否符合要求等);或者对客户提供的图像、视频文件执行加工、质检工作,最终形成客户所需的计算机视觉训练数据集。
自然语言处理(NaturalLanguageProcessing,NLP)是使机器能够像人一样理解语言意图的技术。
以日常生活中的情景为例,寄送快递时使用的“智能填写”功能即运用了自然语言处理技术,在输入框中填入整段联系信息,软件应用能够理解语义,并从中识别及提取“收件人”、“联系方式”、“地址信息”等所需信息,完成自动填写;智能客服、聊天机器人等人机交互程序也运用了自然语言处理技术,使得程序、机器能够读懂人类语言的真正意图,并相应做出反应、提供服务等。
公司通过设计训练数据集结构、采集(收集或编写自然语言文本、对话等数据信息)、加工(对自然语言文本数据来进行单词分割、词性标注、语义语法标注、情感属性标注等)、质检(对数据集进行质量检测,如检验文本、词性或者语义的标注结果是否准确等);或者对客户提供的自然语言文本执行加工、质检工作,最终形成客户所需的自然语言训练数据集。
公司开放基于多年行业经验打磨的数据处理工具集及平台,提供包括公有云访问、私有化部署及SaaS化服务的多种能力,满足产业链上各类企业对于数据处理工具及平台能力的需求。
公司基于自身生产的训练数据提供算法相关的模型训练服务、模型评测服务及模型应用服务,运用训练数据研发能力助力下游客户完成其算法模型的语言拓展、特定算法模块拓展、垂直应用领域拓展等,为客户定制针对特定应用场景的专属算法模型,提高AI技术应用效果。
前述产品、服务均以公司生产的专业训练数据集为核心或基础。公司通过设计训练数据集结构、组织原料数据采集、对取得的原料数据进行加工,最终形成可供算法模型训练使用的专业数据集。
成品训练数据集主要由数据文档、说明文档、技术文档三部分构成。以智能语音训练数据集为例,成品训练数据集包含原始采集形成的音频文件、与音频文件对应的带有时间戳的标注文件,训练数据集相关的设计文档、训练数据集说明,发音词典,数据集参数信息文件等,图示如下:图:训练数据集结构(智能语音)示例 2.2主要产品或服务的终端应用场景 公司提供的高质量、大规模、结构化的训练数据,为算法模型的训练拓展提供了可靠的训练 素材,助力AI技术实现实践应用及商业化落地,赋能AI技术与实体经济深度融合。公司提供的 训练数据广泛应用于众多主流AI产品及终端应用的训练过程中,覆盖了个人助手、语音输入、内 容生成、智能家居、机器人、语音导航、智能客服、智能播报、语音翻译、移动社交、虚拟人、 智能驾驶、智慧医疗、智慧教育、智慧交通、智慧城市、智慧金融、机器翻译、智能问答、信息 提取、情感分析、OCR识别等多种应用场景。图:训练数据集服务的算法模型应用场景示意
(1)定制服务:公司根据客户需求提供定制训练数据集并收取服务费。在此种模式下,公司 享有服务费收入,不享有最终生成的训练数据的知识产权,不可将此类业务生产的训练数据向其 他客户重复销售。 (2)标准化产品:公司开发自有知识产权的训练数据集产品,通过销售训练数据集产品的使 用授权许可,获取让渡资产使用权收入。此类训练数据集一经开发完成,可多次销售并获取授权 许可收入。 (3)训练数据相关的应用服务:公司基于积累的训练数据和多年行业经验提供数据处理工具 集及平台服务、算法相关的模型训练、模型评测及模型应用服务,通常以软件授权或软硬件一体 化形式交付平台产品、算法模型拓展、开发成果等,获取让渡资产使用权收入和技术服务等收入。 2. 生产或服务模式 (1)训练数据集生产模式 公司通过设计训练数据集结构、组织原料数据采集、对取得的原料数据进行加工,最终形成 可供算法模型训练使用的专业数据集。图:训练数据生产过程示意图
公司的训练数据生产过程主要包括四个环节:设计(训练数据集结构设计)、采集(获取原料数据)、加工(数据标注)及质检(各环节数据质量、加工质量检测)。
公司开放基于多年行业经验打磨的数据处理工具集及平台,提供包括公有云访问、私有化部署及SaaS化服务的多种能力,满足产业链上各类企业对于数据处理工具及平台能力的需求。
公司基于其生产的训练数据提供算法模型相关的训练、评测及应用服务,助力下游客户完成其算法模型的语言拓展、特定算法模块拓展、垂直应用领域拓展等,为客户定制针对特定应用场景(例如特定行业、特定口音等)的专属算法模型,提高AI技术应用效果。
以某大型科技公司客户项目为例,客户研发了特定语音识别算法模型,需要根据算法模型的实际场景(如法院庭审场景)开发落地应用。公司承担了部分落地应用拓展相关的开发工作,围绕客户的算法模型和接口开发,最终协助客户算法模型实现多个麦克风收集庭审语音内容并实时转成文字记录入系统的功能。
数据服务采购:公司在数据采集、加工环节中,向人力资源服务等类型的公司等供应商采购的,非核心技术环节的原料数据采集、标注服务。
岗位服务采购:主要针对临时性的、不设长期岗位的业务领域的外包采购,如保洁、临时招聘服务、少量实习生招聘等。
其他采购:(1)训练数据生产所需的资产,主要包括软、硬件设备及其他需求物品采购;(2)日常运营所需的资产及物品,如办公用房、车辆、办公家具、计算机设备等;(3)日常专项服务采购等,主要包括审计服务、会议服务、差旅服务等。
上述原料数据采集、加工环节所涉及的数据服务采购,为公司最主要的采购类别,由集采中心负责;各部门岗位服务采购由人力资源部负责;其余日常运营相关的资产物品采购、专项服务采购等非业务采购由集采中心负责。财务中心负责参与采购供应商的遴选、监督与管理,并对采购费用进行核算及结算。
经过多年的发展,公司已经建设有完善的《海天瑞声采购管理制度》、《海天瑞声项目资源采购管理制度》、《海天瑞声供应商管理制度》、《海天瑞声岗位服务采购管理制度》等内部规范制度,设立有完善的采购流程和体系,并与主要的供应商形成了良好稳定的长期合作关系。
公司采用直接对接并服务客户的直销模式进行营销,符合行业通行惯例。公司以高质量的训练数据集及相关服务吸引客户,并在持续服务客户的过程中提升服务价值和客户黏度。公司通过直接拜访潜在客户、参与学术会议和行业展会新产品发布、搭建并持续升级公司官方网站和建立自媒体矩阵等方式提升品牌知名度、开拓新客户,后续再通过商务谈判、招投标等形式获取具体业务机会。
当前,全球人工智能产业正迎来历史性发展拐点,政策、技术与应用的三重共振推动行业进入高速增长通道。中、美、欧三大经济体持续加码AI布局:中国通过《新一代人工智能发展规划》和《十四五数字经济发展规划》等构建了涵盖研发技术、资源建设和标准制定的全链条政策体系;美国则依托《人工智能行政令》和星际之门计划(Stargate)等,持续巩固其在人工智能基础设施领域的领先优势;欧盟以《人工智能大陆行动计划》为纲领,配套《数字欧洲计划(2025-2027年工作方案》专项资金,重点培育AI与高性能计算融合创新。技术层面,人工智能也正在经历革命性突破,DeepSeekR1等开源模型通过性能提升与成本优化的双重突破,显著降低了技术应用 门槛;多模态大模型(如Sora、GPT-4o)也在不断拓展AI能力边界,实现全模态互动能力。这 种技术平权运动正在加速AI向千行百业渗透,大模型已逐步开始向金融、医疗、制造等核心领域 进行新一轮的赋能,智能风控、AI辅助诊断、智能制造等应用场景不断丰富,推动各行业效率提 升和模式创新。全球AI产业也将在上述政策引导、技术迭代与商业落地的正向循环下,迎来前所 未有的发展机遇,加速向规模化、价值化阶段迈进。 根据国际数据公司(IDC)的数据,2024年全球AI(AI)IT总投资规模为3,158亿美元, 预计在2028年增至8,159亿美元,年复合增长率(CAGR)为32.9%。数据来源:国际数据公司(IDC)(未完)