发布时间 : 2020-09-17 阅读量 : 1561
2019年9月15至19日,全球语音顶级学术会议 interspeech在奥地利格拉茨举行。本期会议主题为“crossroads of speech and language”,主要探讨语言多样性、应用多样性以及表达方式多样性。 magic data作为领先的人工智能数据服务提供商,受邀参加本次展会。
作为全球最大的综合性语音信号处理领域的科技盛会,本届interspeech吸引了谷歌、阿里、亚马逊、滴滴、facebook等科技互联网巨头。会议期间,来自全球学术界和产业界的研究人员齐聚一堂,讨论语音领域的新技术,包括语音合成、语音识别、语音增强这些细分领域。在会议上展示的研究成果代表着语音相关领域的最新研究水平和未来的发展趋势。
随着人工智能行业的发展和应用场景的落地,数据的重要性愈加凸显。
北京magic data科技有限公司是一家国内领先的人工智能数据服务提供商,致力于为企业客户提供语音、图像、文本数据的结构化数据服务。数据标注是机器感知世界的“起点”,将混乱和无序的数据进行清洗,将规范化的数据“喂养”给模型才能不断提高ai的使用精度。
为了满足市场对结构化数据的需求,magic data自主研发了大数据结构化rpa平台,利用人工智能技术对数据采集、标注、质检等过程进行监督,为数据结构化过程赋能。基于该平台,magic data的数据结构化程度好,数据制作精度高。magic data有效地结合监督学习、半监督/无监督学习、迁移学习、自适应等ai技术为客户提供全链的数据服务。同时,基于对行业趋势的判断和客户需求的洞察,magic data建立了多语种发音词典和标签体系,为客户提供高效的定制化服务。magic data的技术团队成员是来自多领域的专家,多元的知识背景和从业经验能够保证技术凯发体育网的解决方案的先进性和高效率。
目前,magic data已经有超10万小时多语种多场景的标准数据集。线上采集的数据集与标准数据集叠加训练模型,能大幅缩短训练时间,提高识别效率,降低建模成本。帮助ai公司及行业内头部客户获得精度可达99%的数据快速处理能力,并以此为基础搭建人工智能应用。 magic data大力推动数据开源,为促进ai行业发展添薪蓄力。会议期间,magic data发布了日语手机朗读开源数据库。该数据库由37位来自日本不同区域(关东、关西、北海道等)的发言人参与采集,录制文本为日常用语,用于语言识别测试。此前,magic data还在openslr上开源了755小时的中文手机朗读数据库,可用于训练、开发、测试等多种用途。
magic data的展位现场,也吸引了来自全球不同地区的科研机构及企业厂商代表,他们对magic data高质量且专业的数据服务能力展现出极大的兴趣。据了解,magic data与海内外多家知名企业建立了长期稳定的合作关系,涉及产学研各个领域,核心客户重复合作率高达80%。
magic data将用心做好每一份数据,解锁更多应用场景,服务更广域的客户,助力人工智能产业化发展。通过全流程智能算法,优化ai供给端的生产方式,开创大数据结构化处理的“4.0时代”。