magic data-凯发体育网

发布时间 : 2022-09-02 阅读量 : 215

近日，图灵奖得主 yann lecun 对于人工智能的前景提出最新思考，“语言只承载了所有人类知识的一小部分；大部分人类知识、所有动物知识都是非语言的；因此，大语言模型是无法接近人类水平智能的”。yann lecun认为，当前流行的大规模语言模型存在明显的极限。未来 ai 领域努力的方向或许应该是让机器优先理解真实世界其他层面意义上的知识。

而就在不久前，google工程师blake lemonine对外宣称谷歌的大型语言模型lamda具有人类的“自我意识”，在他的看法中，即便藉由openai开源架构形式建构的最大语言神经模型gpt-3打造的人工智能，亦可能出现“人”的意识。

关于人工智能到底是否具有“人格”的讨论遍布国内外社交平台，领域内的研究者持有着各自不同的看法。

「ai到底有没有“意识”，其智能极限是否有限？」

关于ai是否有“意识”这个问题，从客观唯物主义思想看，答案是否定的。即使ai能够遍览全书通晓古今，也不能定义其具有“意识”。人类的自我意识除了能理解书面表达意识之外，具有因个人过往经历不同，从而拥有不同的思维与共情模式的特征。

例如，人类之间的交流，当提到“妈妈”这个词的时候，因为不同的经历或者与对话者共同的经历，我们会有不同的话题延拓，大脑中大量的信息、情感区域都会产生联动。ai也可以谈论所有这些事情，但并不意味着它理解正在谈论的内容。

纵然ai能够集百家之所长，但是却无法集一个人的平生经历或者经验与一体。如yann lecun所提，最根本的问题在于语言的有限性。一旦我们放弃了关于意识和语言之间联系的假设，这些系统就注定只能有关于世界的肤浅理解，永远无法接近人类的“全面思维”。

而即便大语言模型lamda能够对人类的对话做出合理的预测，它也不过是接受了数十亿单词的训练，将文本转换为“token”和“嵌入(embedding)”，然后对嵌入进行处理以添加其他维度。比如文本序列中单词之间的关系以及它们在句子和段落中的作用，并学会通过预测下一个单词序列来回应提示。

「与其争论ai意识与智能水平，何不善假于物呢？」

荀子曰“君子生非异也，善假于物也”。意思是：君子的本性同一般人没有什么差别，但是他们善于借助外物进行学习。其实人类社会中，有很多美好的灵魂都被边缘化，他们就是残障人士，中国总共八千万残疾人，但我们在大街上很少遇到残疾人，即便再高贵的灵魂和自我意识，外在躯体的不方便仍让他们珠玉蒙尘。倘若让ai的外在能力辅助残障人士的生活和工作，岂不是获得共赢。

目前，国内已有团队开始进行这方面的研究。天津理工大学“鲸言创益”无障碍智能科技研发团队用近5年时间，构建视频语料库，研发“复杂场景下中国手语实时翻译系统”。在听障人士打手语的同时，屏幕上就能够自动“翻译”出文字，只为让更多听障人士被“听见”。

无独有偶，上海首个盲人咖啡“种子店”在浦东新区华润时代广场开启试营业。双胞胎兄弟殷天保、殷天佑是两个盲人，但是他们现在已经依靠在线语音识别技术辅助自我在社会上实现了个人价值。

而训练这些ai的语音和自然语言相关的语料，通常由专业数据团队提供，通过更多的数据才能让ai变得更加“smart”。magic data作为一家为众多ai产品提供数据的专业数据采集、标注公司，其中涵盖各个领域与语种的对话数据、自然语言处理数据以及图像数据，其样例如下：

中文人机交互语料库：

广东粤语语料库：点击查看详情

英文车载命令控制语料库：

荣誉｜magic data获评中国电子联合会「2022智慧赋能名牌企业」

2023年4月15日，中国电子信息行业联合会在武汉首届中国软件创新发展大会上，发布了“2022年智慧赋能名牌企业”。北京爱数智慧科技有限公司（magic data）荣获“创新成长型”智慧赋能名牌企业。获奖企业是围绕智慧赋能基础关键技术、智慧赋能应用关键技术、智慧赋能凯发体育网的解决方案三个方向，重点突出企业研发投入和创新成果、市场占有率和品牌持续性、企业规模和成长性、服务质量保障及企业特色性，遴选的典型及成长新锐企业。

案例｜智慧教育：用ai训练数据打造领先教育科技产品

用科技赋能教育是近年来教育领域中备受关注的话题。科技在教育领域中的应用，可以帮助教育者更加高效、个性化地实现教学目标，同时提高学习者的学习效果和体验。智慧教育项目集成各种先进的ai技术，例如语音识别和自然语言处理等，来实现个性化推荐、智能评估和自适应学习等功能。本文将介绍我们的客户如何通过打造英语口语智能评分系统为智慧校园注入活力。

案例｜智慧金融：借助ai训练数据打造全新数字员工

彭博近日发布了金融领域大语言模型：bloomberggpt，500 亿参数语言模型（*）。数字化、智能化转型正在各行各业全面铺开，人工智能等技术加速向金融业渗透，保险从业机构保持技术的敏感度，持续提升创新能力，不断挖掘增量市场，以应对科技发展带来的挑战和机遇。magic data作为领先的ai数据凯发体育网的解决方案提供商，深耕对话式人工智能领域，期待能在未来持续为行业客户提供数据侧支持，从数据科学的专业视角赋能客户的数智化转型。

张晴晴：对话数据推动aigc——大模型底层数据探索

“training data is technology” .数据即科技，openai的联合创始人ilya sutskever在与知名科技媒体the verge访谈中提到。chatgpt自发布以来热度席卷全球，一周前惊艳亮相的gpt-4更是让人感叹我们迎来了ai发展的历史性时刻。然而我们也困惑，openai为何不开源gpt-4？在我们看来，更多的奥秘或许存在于数据之中......本文是magic data创始人兼ceo张晴晴博士关于数据、大模型与生成式ai的观点分享。

客户案例｜多人会议对话数据集助力高效迭代智能在线会议功能

数字化时代，传统的会议凯发体育网的解决方案已经无法满足高效协同需求，企业对于多端、多人、多元场景线上协作效率有了更高的要求。本期客户是国际知名通讯和协作凯发体育网的解决方案企业，其业务重点之一是向企业用户提供稳定高效智能的线上会议沟通工具。

magic data-凯发体育网

即刻与 magic data 建立联系？