“归一”是啥子意思?机器听懂了!在贵州这些科技公司,数据就是金钱

动静原创 | 2022-04-01 14:20

在位于惠水百鸟河数字小镇的贵州梦动科技公司里,人工智能数据服务部的300多个年轻人,正在对图像、文本、语音、视频等数据进行采集和标注,他们被称为人工智能训练师,主要工作就是通过人工辅助对海量数据进行标注,提升机器的学习能力。

公司项目运营主管李欣正在对一个涉及贵州语音和四川语音转化的数据项目进行标注:“我们需要把机器不认识的四川语音转化为普通话,比如说:“幺不倒台”(四川话),帮助机器翻译成普通话就是“不得了”,“归一”(贵州话)就是“完了”意思。

目前,除了普通话外,机器已逐步听懂了四川、贵州等地的方言和部分少数民族语言,海量数据一旦可以被计算机识别、提取和分析,就可以变成数据资产。在这个语音转换平台上,语音转化文字的服务,每分钟可以卖到三毛钱,准确率最高可达97.5%。

“去年总计交付无人车类数据8000多万帧,方言语音识别3000多个小时,部门已实现产值千万元以上。”贵州梦动科技有限公司数据服务部总监曾芸说。

如今,梦动科技正为百度、科大讯飞、腾讯、京东等企业提供数据采集与标注服务。2020年,企业入选全国数据标注公司排行榜前10强,2021年,企业实现主营业务收入近1亿元,解决就业200多人。

贵州梦动科技有限公司CEO 盛华表示,国发2号文件提到,激活数据要素潜能,这是企业的政策红利,企业接下来要在数据的处理和营销两个业务继续努力,希望在2022年企业的营收破1.5亿元。

数据资源变资产,离不开数据清洗和脱敏加工环节,这是保障数据安全必不可少的重要一环。在60多公里外的贵阳市花溪区,贵州数据宝网络科技有限公司正在对全国高速公路数据进行清洗和脱敏。全国16万公里的高速公路,1.2万个高速收费站口和4万多个龙门架实时采集的交通信息都汇聚于此,数据经过加工处理后,被运用在“互联网+物流”等领域。

贵州数据宝网络科技有限公司商务总监杨光应表示,基于这些数据,公司主要做了两个产品,第一个是开发了非营运货车的风险模型评估,第二个是针对物流司机提供的金融产品。

2021年,数据宝公司实现营收超过亿元,带动就业近200人,被工信部评为国家级大数据试点示范项目。

贵州数据宝网络科技有限公司董事长汤寒林告诉动静记者,国发2号文件一定会助推贵州省的大数据产业发展,奠定贵州作为大数据先行者的地位。接下来,企业要聚焦数据价值的挖掘,“希望能够早日上市,成为贵安新区大数据领域的上市公司”。

根据相关部门统计数据显示,2021年我省软件和信息技术服务业实现软件业务收入426.2亿元,较2015年增长2.8倍。全省数字经济占比达34%、增速连续六年位居全国第一,大数据成为引领贵州经济社会发展的新引擎与世界认识贵州的新名片。到2025 年,全省大数据电子信息产业总产值突破 3500 亿元;全省数字经济增加值实现倍增,在 GDP 中的占比达到 50%左右。