发布时间 : 2023-03-31 阅读量 : 85
彭博近日发布了金融领域大语言模型:bloomberggpt,500 亿参数语言模型(*)。数字化、智能化转型正在各行各业全面铺开,人工智能等技术加速向金融业渗透,保险从业机构保持技术的敏感度,持续提升创新能力,不断挖掘增量市场,以应对科技发展带来的挑战和机遇。magic data作为领先的ai数据凯发体育网的解决方案提供商,深耕对话式人工智能领域,期待能在未来持续为行业客户提供数据侧支持,从数据科学的专业视角赋能客户的数智化转型。
客户公司是国内重要保险从业机构。随着数字化转型的加速,客户对于智能化客服的需求越来越迫切,希望通过人工智能技术和虚拟数字人等科技创新方式,来完善和升级其运营、营销和客服功能,提升用户体验。通过引入ai数字员工,客户希望在降低运营成本的同时增加效率,打造出一个与众不同的企业形象,这不仅可以吸引更多的新客户,还可以提升企业的品牌价值。
数字员工是数字虚拟人技术在保险业的一个直接应用。外形设计上,数字员工要端庄干练,体现金融从业人员的专业性,在与人交互过程中要能够理解用户的问询意图,并口齿清晰,亲切自然地给出一致的专业解答。
这一过程涉及到计算机图形学,语音识别、语音合成、自然语言理解等技术的综合应用,其中最重要的技术难点就是多模态模型的融合,如:建模中声音和面目表情需要一致,语言、动作、神态三者也需要协调统一,更高质量的融合才能有真实、自然、饱满的人物形象,才有更高的用户接受度。
另外,在产品市场化过程中,不同地域用户会有个性的表达习惯,以及使用口音方言表达的情况,对这些不同语音特征的识别也是语音识别重要的技术挑战。
再次,不同的用户群体,会有不同偏好的交互习惯,符合用户群体的数字员工的性格、人设,可以提升用户体验,针对特定类型的员工,如虚拟投保经理,可以提高用户粘性,增加交易机会。
magic data以专业咨询和数据方案设计的底层能力为支撑,为客户提供了成品语音数据集结合定制化数据采集标注服务的数据交付方案。
首先,针对多模态融合,表情、语音一致性这一不足,magic data结合过往数字人项目专家知识提供定制采标服务,扩充训练集。面部表情采集使用相机阵列完整捕捉模特全部面目表情,语音采集使用贴合落地场景的设备进行采集。采集后的语音和面部表情经过检查,保证时间对齐,减少客户后续数据处理成本。
对于客户数字员工应用重点区域进行分析,提供重点区域方言、重口音,识别训练数据集,直接帮助模型迭代增加语音识别准确性。
在数字员工交互回答部分,提供金融行业领域相关语音合成数据成品集,是数字员工的回答更加富有亲和力、具有专业感。
使用的部分数据集产品
语音识别(asr)成品数据集
金融领域多轮对话文本样例
语音合成(tts)成品数据集
magic data成品数据集经过magic data自研数据采集及标注平台处理,专业团队根据行业领先标准对数据进行清洗、标注、质检验收,端到端的数据处理机制充分保证了数据的高质量及合规性。
通过运用magic data赋能的语音识别、语音合成以及数字虚拟人技术,客户构建了涵盖智能对话系统和虚拟形象的全新数字员工。客户将数字员工引入其运营体系中,在智能营销、智能客服、智能理赔等多个与客户交互的场景落地,显著降低了运营成本,实现了工作流程优化。同时高性能的语音识别和语音合成与灵动的数字员工形象整体提高客户数字员工产品的市场接受度,扩大了客户用户群体,实现了降本增效的目标。
参考资料: