返回首页 > 您现在的位置: 比赛信息 > 技能比赛 > 正文

格灵深瞳2022年年度董事会经营评述

发布日期:2023/4/20 11:01:44 浏览:325

,在人工智能中占据重要地位,已在工业界逐步实现商用价值,步入规模化商业落地阶段。同时,随着相关设备能力的改善(如算力、内存容量、能耗、图像传感器分辨率和光学器件等),提升了应用的性能和成本效益,进一步加快了计算机视觉商业应用的扩展。据iResearch数据,2021年我国计算机视觉产品的市场规模占整个人工智能行业的49.6,达到990亿元,带动相关产业规模超过3,079亿元。预计至2026年,我国计算机视觉核心产业规模和带动相关产业规模将分别增长至2,208亿元和6,733亿元,年均复合增长率分别为17.4和16.9。从市场规模、场景泛用、带动作用来说,计算机视觉领域未来市场空间广阔。

(2)主要技术门槛

公司所属人工智能行业属于技术密集型行业,行业进入壁垒高,产品具有高技术含量、高附加值等特点,企业需拥有高效的研发创新和产业应用能力,头部企业拥有深厚的技术积累和不断进行先进技术探索的机制,在经营方面需拥有不同业务场景的快速商业化落地能力和良好市场口碑,对企业的研发、销售等业务管理能力均有较高的要求。

2.公司所处的行业地位分析及其变化情况

在AI算法层面,公司的核心算法多次在国内外人工智能算法竞赛中夺冠,达到行业领先水平;公司在研发过程中向学术界开源了TriionPairs和Gint360K两个人脸识别数据集,开源了PartiaFC训练代码,推动了行业技术的发展;同时,公司承担了国家科技部、北京市科学技术委员会等多项人工智能技术应用的重大科研项目,并与全国信息安全标准化技术委员会、中国安全防范产品行业协会、中国信息通信研究院、中关村标准化协会、国家工业信息安全发展研究中心、中国电子工业标准化技术协会、中关村智慧城市产业技术创新战略联盟、中关村中安公共安全视频智能应用技术联盟等单位开展多项标准化制定工作。

在AI应用层面,公司已将核心算法技术运用在主营产品中,形成了面向智慧金融、城市管理、商业零售、体育健康、轨交运维、元宇宙等领域的人工智能产品及解决方案,并根据下游客户的需求不断优化、升级核心技术,确保持续的技术创新。公司的主营业务产品在下游主要核心客户的认可程度高,良好的市场口碑为公司市场拓展及持续发展奠定了重要基础。

人工智能下游的应用领域众多,目前与公司同行业的人工智能企业在下游应用领域的布局方面各有侧重,未来市场空间较大。公司作为计算机视觉领域的创新型人工智能企业之一,目前尚处于产业化与市场拓展的快速发展阶段,在多个人工智能细分应用领域中已较早完成了产品布局,未来在新应用领域的业务拓展将持续提升公司的市场份额和竞争地位。

3.报告期内新技术、新产业、新业态、新模式的发展情况和未来发展趋势

近年来,由于人工智能已成为科技创新的关键领域和数字经济时代的重要支柱,在国家及地方多项政策和资金支持下,我国人工智能技术和产业蓬勃发展,进入了新的发展阶段,应用场景也在不断的拓宽、融合和多元化发展,产业结构逐渐完善,2022年,人工智能在各个行业的渗透率均有提升,在互联网、金融、政府、电信和制造业等行业的应用渗透率居前,成为企业寻求提升用户体验和保持竞争力的重要能力。我国人工智能领域在企业、专利和论文数量等方面都进入国际领先行列,自主研发的开源深度学习框架、开源工具集、开源应用软件、开源社区快速发展,在国际人工智能开源社区的贡献度已成为仅次于美国的第二大贡献国。借助数据获取渠道广、行业应用场景丰富以及总体投资水平高等优势,我国人工智能企业在技术创新与快速商业化方面形成了良好的发展环境,但在人工智能基础理论和原始创新方面仍相对较弱,核心智能芯片和基础元器件的自主研发生产能力与国际领先水平尚存在较大的差距。

数据、算力和算法是人工智能发展的三驾马车。在数据层面,人工智能技术需要大量的标注数据,推动数据规模不断增长,数据服务走向深度定制化,高质量知识集加速构建。在算力层面,2022年2月国家启动实施的“东数西算”工程和智能计算中心的建设通过算力基础设施从点到网的升级,逐步构建起更健全的基础设施结构,而数据的攀升、算法和模型领域的突破更加要求人工智能产品快速、精准地处理大量数据或执行复杂的指令,这对算力提出更高的需求,在技术发展的客观要求、政策的支持和资本的推动等多重因素驱动下,各类人工智能芯片快速演进发展。在算法层面,超大规模预训练模型成为热点,推动人工智能技术效果不断提升,继续朝规模更大、模态更多的方向发展,多模态技术的支持使得单一自然语言处理或计算机视觉模型发展成语言文字、图形图像、音视频等多模态、跨模态模型,推动了AIGC内容多样性的提升,使AIGC拥有了更为通用的能力,引发AIGC技术能力的质变。AIGC作为当前新型的内容生产方式,已率先在传媒、电商、影视和娱乐行业等数字化程度高、内容需求丰富的场景取得进展,展现出了一定的市场潜力,同时,在加快产业升级的进程中,AIGC在金融、医疗、工业等领域的应用也将迅速发展。

作为在人工智能行业技术成熟度较高、商业化进程较快的细分领域,计算机视觉技术从最初的静态人脸识别和光学字符识别起步,逐渐扩展到了人脸识别分析、活体检测、人体识别分析、物体检测识别、行为识别分析等诸多方向,应用场景也从较早的城市管理、金融、互联网、商业零售等领域,扩展到轨道交通、医疗健康、元宇宙、人机交互等创新领域。神经网络和深度学习是计算机视觉的基石,而数据、算力和算法三驾马车的发展极大拉动了计算机视觉技术的发展。海量的应用场景数据为计算机视觉算法提供训练基础,使得算法精准度提升,让机器实现更为精准的视觉识别;人工智能芯片的发展大幅提升了数据处理速度,缩短了计算过程和模型架构调整时间,为计算机视觉的发展提供了算力支持;深度学习算法的发展提升了计算机视觉准确度。目前计算机视觉企业的技术成熟度均已达到较高水平,同行业企业间的技术差异在逐渐缩小,在大部分应用场景下,各企业的技术水平都已经可以较好的满足用户需求,因而未来计算机视觉企业间的竞争将从技术领先性竞争逐步转向以拓展落地场景和理解用户需求为核心的综合服务能力竞争。四)核心技术与研发进展

1.核心技术及其先进性以及报告期内的变化情况

公司打造了底层AI技术平台——深瞳大脑,深瞳大脑作为公司核心技术的驱动平台,赋能公司人工智能产品及解决方案的技术实现。深瞳大脑包含数据平台和训练平台,由数据采集、数据预处理、数据标注、模型训练、模型优选、数据管理等模块组成。

数据平台支持多源多模态数据的自动收集和清洗归类,通过构建自动化处理为主、人工标注为辅的标注体系,形成海量增长的标签数据池,有效节省标注成本,提高了算法模型的研发效率;训练平台则有效提高了模型训练的自动化水平,降低算法多平台部署应用的迁移难度,为算法高效生产及快速商业化应用奠定了重要基础。目前,公司深瞳大脑可支持数十亿训练数据、数亿类别任务,数十亿参数模型的训练。训练平台生产高质量的算法,推动应用的落地,数据平台收集应用产生的高质量数据又促进算法的提升,从而算法、应用、数据在深瞳大脑系统内形成人工智能的正向循环,为公司的高效研发创新与产业应用提供了有力支持。

(1)基于深度学习的模型训练与数据生产技术

公司自研的()算法生产技术通过自有的核心算法结合大数据平台的分析处理技术,支持在海量数据中进行挖掘,主动触发模型更新训练,有效的提高了算法的准确率和生产率。同时,公司自建的数据标注平台,通过组建具有专业背景的标注团队,用人工标注加AI模型自动化预识别的方法,为算法提供精准的基础训练数据,可覆盖公司内部99的算法标注任务。

公司利用自研的底层AI技术平台深瞳大脑对数十亿训练数据进行清洗,并基于大规模数据训练大模型,在海量数据下,研发了基于多模态弱监督的大模型训练算法,节省了大量数据标注资源。该算法已投稿到国际顶级会议ICLR2023并被接收,公司已在业务中利用该大模型提升少样本场景的准确率,进一步验证了该大模型在下游任务中的泛化能力。

跨平台模型训练技术用于简化AI算法生产,该技术基于自主研发的训练框架,可实现常用业务AI算法的一键式训练,为常见业务中的分类、检测等算法提供便捷快速的实用模型。针对不同应用场景的算法开发,公司自主研发的跨平台模型训练技术可将训练任务管理平台产出的模型自动发布到各种类型的显卡或平台,包括英伟达显卡、嵌入式平台、海思平台、华为Atas计算卡等,无需人工干预,从而达到模型快速高效交付的目的,可有效的降低研发成本,有助于提升产品的市场竞争力。

(2)3D立体视觉技术

3D立体视觉一般通过结构光、激光雷达等特殊传感器采集得到场景的深度信息,再利用深度信息和可见光信息一同计算出场景的三维图像。

多目传感器标定与深度估计技术使用一对成本更为低廉的可见光相机组成双目系统,对场景深度信息进行估算,在达到普通结构光相机精度的同时,提高了相机的可靠性和易用性,并能覆盖更多的结构光相机无法工作的光线条件和场景。基于这项技术的输出,使公司的算法能更好地适应多种不同的场景和目标,进而对人体、物体、场景进行高精度的重建。

运动姿态分析技术通过采集不同场景下人体姿态数据,通过自主研发的三维人体姿态估计算法,能够解决人体关键点数据采集不准确或不稳定的问题。公司基于单目相机的三维重构技术结合动作模型库及人体运动功能学的特点,优化了使用单目相机获取三维人体关键点的效果,解决了基于二维人体关键点进行判断的难题,使得运动姿态分析算法在三维人体上做出更为精准的判断,进而可以应用在体育健康与行为分析领域对人体三维姿态的准确识别与分析。

运动姿态分析技术在智慧金融领域可以协助银行客户进行员工履职分析与管控,人员重点区域违规管控(如非授权人进入、员工缺岗等)、人员操作异常管控(如单人加钞、大额现金遗留等)、人员动作异常管控(如异常倒地、打架、各类防护舱业务等)等项目均达到较高的检测精度;而在体育健康领域,该技术可评判用户动作是否完成及标准程度,评判仰卧起坐、引体向上、跳绳、篮球交替运球、篮球护球训练等17项基础测试和训练动作时,也可具备较高水平的检测精度。3D重建与立体视觉分析技术在轨交运维场景可将离散的局部列车零部件数据进行融合和重构,得到列车标准模型,将几何模型分析、深度学习等技术运用到列车标准模型、点云数据、图片等多维度数据,进行零部件匹配和故障诊断。公司基于深度学习的点云配准技术已在多个学术数据集上取得第一,通过点云几何结构和基于Transformer的多层特征投票机制提升正确匹配点云比例,提升点云配准精度,在真实业务测试集上旋转向量误差小于1度、平移向量误差小于0.3mm,该技术对产品落地起到了至关重要的作用。目前,公司产品已覆盖列车常见的190余种故障项点,项点处理速率超过20,000个/小时,在高级重要性项点的故障诊断成功率大于95,对于高精度测量的项点,测量精度到达亚毫米级别。

(3)自动化交通场景感知与事件识别技术

公司拥有国内领先的车辆识别技术,能够运用高精度目标检测与跟踪技术对大陆号牌、港澳号牌、非机动车号牌等多种类型的车牌进行多种尺寸和角度的识别,支持倾斜角度在45°范围内的车牌,准确率在99以上。同时,公司支持的机动车、非机动车、人体属性识别多达50余项,重点属性识别准确率超过95。

在对交通场景中车辆进行分析时,公司结合在人脸识别技术上的优势研发了多目标属性识别与对象关联技术。该技术可以将车内驾驶员与车辆绑定,协助交通管理部门和公安部门查找可疑人员,提供破案线索。由于车内光线较暗、抓拍受挡风玻璃干扰、司乘人员人脸姿态不受控、人脸有遮阳板墨镜口罩等遮挡的原因,普通的人脸识别算法都会有较大的下降,公司在人脸识别技术上的优势可以做到在以上困难环境下仍能达到较高的识别率。

公司研发的交通场景理解及事件检测识别技术,基于自适应交通场景理解和车辆特征识别的技术能力,无需人工标注,可自动化识别闯红灯、不按导向行

上一页  [1] [2] [3] [4]  下一页

最新技能比赛

欢迎咨询
返回顶部