magic data-凯发体育网

发布时间 : 2022-09-16 阅读量 : 209

2022年7月4日起，由中国科学院声学研究所、西北工业大学、新加坡a*star信息通信研究所、上海交通大学以及magic data联合主办的 “iscslp2022对话短语音说话人日志挑战赛” (iscslp 2022 conversational short-phrase speaker diarization challenge, cssd)，自开展以来共收到了四十多支国内外研究机构、大学及知名企业的参赛队伍注册报名。9月16日，组委会正式公布本次挑战赛成绩排名。

「竞赛结果与排名」

经过激烈的角逐，本次iscslp2022对话短语音说话人日志挑战赛获奖队伍如下，恭喜获奖团队！

「挑战赛背景」

对话场景是语音处理技术最重要的场景之一，同时也是最具挑战性的场景。在日常对话中，人们以随意的方式相互回应，并以连贯的问题和意见继续对话，而不是生硬地回答对方的问题。精准检测对话中每个人的语音活动，对于自然语言处理、机器翻译等众多下游任务至关重要。说话人分类系统的评价指标是分类错误率（der）长期以来一直被用作说话人分类的标准评估指标，但它未能对短对话短语给予足够的重视。这些短对话短语持续时间短，但在语义层面上起重要作用。语音社区也缺乏有效评估对话中短语音分类准确性的评估指标。

围绕这一难题，我们开源了 magicdata-ramc中文对话语音数据集，其中包含 180 小时人工标注对话语音数据。同时针对cssd测评，我们还准备了 20 小时对话测试数据，并人工对说话人时间点进行了精准标注。针对cssd挑战，我们同时设计了一个新的准确度评估指标，用于计算句子层面说话人分割聚类的精度。通过推动对话数据分割聚类技术的研究，我们旨在进一步促进该领域的可重复研究。

「打分工具介绍」

为了评价说话人日志系统的性能，我们提出了conversational-der (cder) 的指标。传统的der 可以在时间尺度上评估说话人分类系统的整体性能。但是，在实际对话中，有时较短的持续时间包含重要信息，基于时间尺度的系统评价标准难以反映短时片段的识别性能。因此我们提出了cder ，在句子级别评估说话人日志系统。

更多详情：

「致谢」

感谢来自中国科学院声学研究所、西北工业大学、新加坡a*star信息通信研究所、上海交通大学以及magic data在语音领域深耕多年，有着丰富研究和实战经验的专家，作为竞赛组委会成员，全程给予答疑支持和指导。

感谢segmentfault思否开发者社区、稀土掘金技术社区、示说网等多家社区的大力支持。后续我们将会对业界开放基础算法框架，同时也寻求学术和工业界在该问题的先进算法和技术，携手共建更优的凯发体育网的解决方案。

荣誉｜magic data获评中国电子联合会「2022智慧赋能名牌企业」

2023年4月15日，中国电子信息行业联合会在武汉首届中国软件创新发展大会上，发布了“2022年智慧赋能名牌企业”。北京爱数智慧科技有限公司（magic data）荣获“创新成长型”智慧赋能名牌企业。获奖企业是围绕智慧赋能基础关键技术、智慧赋能应用关键技术、智慧赋能凯发体育网的解决方案三个方向，重点突出企业研发投入和创新成果、市场占有率和品牌持续性、企业规模和成长性、服务质量保障及企业特色性，遴选的典型及成长新锐企业。

案例｜智慧教育：用ai训练数据打造领先教育科技产品

用科技赋能教育是近年来教育领域中备受关注的话题。科技在教育领域中的应用，可以帮助教育者更加高效、个性化地实现教学目标，同时提高学习者的学习效果和体验。智慧教育项目集成各种先进的ai技术，例如语音识别和自然语言处理等，来实现个性化推荐、智能评估和自适应学习等功能。本文将介绍我们的客户如何通过打造英语口语智能评分系统为智慧校园注入活力。

案例｜智慧金融：借助ai训练数据打造全新数字员工

彭博近日发布了金融领域大语言模型：bloomberggpt，500 亿参数语言模型（*）。数字化、智能化转型正在各行各业全面铺开，人工智能等技术加速向金融业渗透，保险从业机构保持技术的敏感度，持续提升创新能力，不断挖掘增量市场，以应对科技发展带来的挑战和机遇。magic data作为领先的ai数据凯发体育网的解决方案提供商，深耕对话式人工智能领域，期待能在未来持续为行业客户提供数据侧支持，从数据科学的专业视角赋能客户的数智化转型。

张晴晴：对话数据推动aigc——大模型底层数据探索

“training data is technology” .数据即科技，openai的联合创始人ilya sutskever在与知名科技媒体the verge访谈中提到。chatgpt自发布以来热度席卷全球，一周前惊艳亮相的gpt-4更是让人感叹我们迎来了ai发展的历史性时刻。然而我们也困惑，openai为何不开源gpt-4？在我们看来，更多的奥秘或许存在于数据之中......本文是magic data创始人兼ceo张晴晴博士关于数据、大模型与生成式ai的观点分享。

客户案例｜多人会议对话数据集助力高效迭代智能在线会议功能

数字化时代，传统的会议凯发体育网的解决方案已经无法满足高效协同需求，企业对于多端、多人、多元场景线上协作效率有了更高的要求。本期客户是国际知名通讯和协作凯发体育网的解决方案企业，其业务重点之一是向企业用户提供稳定高效智能的线上会议沟通工具。

magic data-凯发体育网

即刻与 magic data 建立联系？