6月30日,标贝科技正式上线AI数据平台,该平台是标贝基于多年AI技术能力以及业务流程的积累,通过不断迭代开发,最终形成的AI数据采集和标注的综合平台。用AI技术辅助贯穿数据服务的全流程,高效的人机协作实现数据生产效率与数据质量的双提升。数据平台的详细信息和演示操作,可以访问标贝官网进行体验。
AI数据服务市场需求持续增长
众所周知,人工智能的三驾马车是数据、算力、算法。想要实现AI场景的落地,就需要大量的相关数据。数据的质量和数据的覆盖度,在很大程度上决定最终的AI系统能力。近几年,随着人工智能产业的迅猛发展,数据服务产业也得以快速增长。据iResearch数据显示,2020年数据标注行业市场规模突破36亿元,预计2025年市场规模将突破100亿元。
虽然当前垂直细分领域的AI需求激发了更多专业的数据标注需求,但是由于行业标准规范的缺失,国内的数据标注产业发展仍面临着不少问题和挑战。首当其冲的就是数据质量参差不齐、生产效率不足。
人机协同智能化采标体系赋能数据生产效率提升
作为国内AI数据服务代表品牌,自成立以来,标贝科技扎根AI数据领域,坚持技术创新,打造了领先的场景化数据采集能力以及高精度的数据标注能力,持续为客户提供高质量AI数据。同时,标贝科技还不断探索创新服务模式,致力于为人工智能产业创造更多商业价值。
近日,标贝科技聚合多年AI技术和业务经验积累,搭建完善的一体化数据采标工具体系——标贝AI数据平台,提供高效的数据采集和标注能力,覆盖数据生产的全链路。
标贝AI数据平台采用智能化的人机协同方式,支持语音、图片、视频以及点云等全数据类型的采标业务,AI技术辅助贯穿全环节。高效、准确地为算法研发人员提供优质数据,满足各种不同复杂场景应用的需求。
标贝AI数据平台
标贝AI数据平台覆盖语音、图像、视频以及3D点云等不同的AI数据标注需求。客户可以根据业务需求实现对标注工具的灵活配置,提升数据标注的效率,解决AI落地场景多样性、复杂性的数据需求。
标贝数据平台贯通了从数据处理、项目立项、任务分配、标注、质检、验收全流程。可以根据项目需求,创建不同角色,进行权限分配管理,每个环节有相应专业人员来把控数据标注的质量和时间节点,在保证质量的前提下提升效率。同时,平台配置了丰富的标注模板和标注工具,满足客户差异化的标注需求。
l 3D点云标注
近年来,自动驾驶技术得到突飞猛进的发展,其中部分能力已经落地在很多商用化的智能汽车上。在自动驾驶技术中,其感知系统主要通过Lidar激光雷达、Camera相机、Radar毫米波雷达3个类别的传感器来进行道路环境感知。其中基于激光雷达生成的3D点云数据尤其重要。
3D点云的数据需要通过精细化的标注,才能应用于自动驾驶系统的训练。原始的点云数据需要通过专业的标注工具,将道路目标物体(包括但不限定于车辆、行人、广告标注、树木等目标)精确标注出来,才能最终应用到自动驾驶的系统训练中。
标贝科技拥有先进的点云渲染技术,支持点云语义分割、点云标注、3D连续帧等标注能力。在AI智能辅助标注方面,标贝3D点云平台拥有噪点去除、点云分割、自动贴合、连续帧插值辅助、2D3D映射等一系列提高效率和高准确度的标注工具。
噪点去除:一键清除噪点,减少标注员视觉干扰,为标注员提供更清晰可见的点云视图,从而提高标注准确度。
点云分割:依托于高精准度的视觉模型,提供点、画笔、圆形、矩形四种标注工具,不仅能满足多种标注需求,还可以通过对点的样式设置,带来更好的视觉体验。
▲点云分割
自动贴合:通过自动贴合算法辅助,检测框体内的点云集合,自动计算方向和标注物体大小,节省人工调节时间,提高准确度,降低标注难度。
▲自动贴合
连续帧插值辅助:通过计算对象跟踪和插值算法预测物体之间的位置关系,预测物体在每帧的位置,提高标注效率。
▲连续帧插值辅助
2D3D映射:提供2D3D传感器融合技术,标注3D的同时,自动生成2D图像上的标注,快捷实现2D和3D之间的协同标注。
▲2D3D映射
标贝的点云标注平台还具备丰富的人工智能辅助功能,内置的Lidar-光学融合感知模型,可以对常见的场景和物体(包括人、车、自行车、路障等)进行预标注,大幅度降低人力重复劳动,提升标注效率。
目前,标贝3D点云标注已经支持大多数主流的点云数据格式,同时支持扩展更多客户定制化数据结构。
随着近几年自动驾驶技术发展驶入快车道,自动驾驶技术需要的训练数据量几乎是呈指数级增长。标贝3D点云将通过精细化的智能标注服务,为自动驾驶场景的客户交付更高质量的数据。
l 2D图像标注
标贝2D图像标注平台提供点、线、矩形框、多边形等多种操作工具,支持对人脸、OCR、物体、车道线、外景等场景下的2D图像进行标注。
标贝2D图像标注搭载了丰富的智能化辅助标注功能以提升标注效率。例如,支持自动识别当前图片的物体类型,对识别结果自动添加品类标签,进行特征归类或分类整理;支持对图片文字内容进行自动画框,并识别框内的字符,将识别结果自动填充到平台标签内。支持通过智能AI语义分割模型配合人工手动补点,快速完成像素级图像类别的物体区域分类标注。此外,标贝2D图像标注还具备自动目标检测能力,快速实现视频中相同目标的跟踪和定位。
▲目标检测
l 语音标注
基于标贝自研算法,语音标注平台支持多种语言的预标注能力。可以实现长语音批量自动画段切分,并将音频内容自动转写成文字。在机器智能化识别的基础上,人工只需要进行校对,大大提升了标注效率和准确率。
语音标注平台还拥有专业的语音展示能力,除了可以正常显示语音的波形图之外,还可以显示语音的频谱图,可以更方便分辨在低信噪比情况下的语音切分边界。
▲语音频谱图
标贝数据采集平台-标贝易采
标贝易采是一款集语音、图像、视频采集为一体的数据采集平台,通过web管理后台+采集端APP,实现数据采集到项目验收的全流程管理。采集端覆盖安卓和iOS所有机型。
标贝易采内置语音质量自动化判断能力,通过声纹识别、声音理解技术,以及多种音频质量检测算法,可以实现在采集端上实时对采集的语音数据进行质量判定,自动检测出空音频、截幅以及信噪比等质量不合格的样本,同时对于相关检测属性标签,可以同步提交给后台质检和验收环节进行展示,质检和验收人员只需要对最终结果进行判定,大幅降低了人工质检的成本,缩短项目执行周期。
此外,标贝易采还提供国际版,可以支持大多数国家和地区的数据采集业务。
随着未来人工智能与经济社会发展的深度融合,AI数据服务将发挥越来越重要的影响。标贝科技将继续躬身力行,秉持“让AI赋能数字世界”的使命,打好AI数据服务基石,探索更多复杂的数据应用场景,以创新驱动变革,以技术引领数据高质量发展,释放更大的商业价值,加快推动人工智能技术的更广泛的落地。