最新发布!查看 magicdata 成品数据集

magic data-凯发体育网

press images

发布时间 : 2022-09-02     阅读量 : 215

近日,图灵奖得主 yann lecun 对于人工智能的前景提出最新思考,“语言只承载了所有人类知识的一小部分;大部分人类知识、所有动物知识都是非语言的;因此,大语言模型是无法接近人类水平智能的”。yann lecun认为,当前流行的大规模语言模型存在明显的极限。未来 ai 领域努力的方向或许应该是让机器优先理解真实世界其他层面意义上的知识。

而就在不久前,google工程师blake lemonine对外宣称谷歌的大型语言模型lamda具有人类的“自我意识”,在他的看法中,即便藉由openai开源架构形式建构的最大语言神经模型gpt-3打造的人工智能,亦可能出现“人”的意识。

关于人工智能到底是否具有“人格”的讨论遍布国内外社交平台,领域内的研究者持有着各自不同的看法。

「ai到底有没有“意识”,其智能极限是否有限?」

关于ai是否有“意识”这个问题,从客观唯物主义思想看,答案是否定的。即使ai能够遍览全书通晓古今,也不能定义其具有“意识”。人类的自我意识除了能理解书面表达意识之外,具有因个人过往经历不同,从而拥有不同的思维与共情模式的特征。

例如,人类之间的交流,当提到“妈妈”这个词的时候,因为不同的经历或者与对话者共同的经历,我们会有不同的话题延拓,大脑中大量的信息、情感区域都会产生联动。ai也可以谈论所有这些事情,但并不意味着它理解正在谈论的内容。

纵然ai能够集百家之所长,但是却无法集一个人的平生经历或者经验与一体。如yann lecun所提,最根本的问题在于语言的有限性。一旦我们放弃了关于意识和语言之间联系的假设,这些系统就注定只能有关于世界的肤浅理解,永远无法接近人类的“全面思维”。

而即便大语言模型lamda能够对人类的对话做出合理的预测,它也不过是接受了数十亿单词的训练,将文本转换为“token”和“嵌入(embedding)”,然后对嵌入进行处理以添加其他维度。比如文本序列中单词之间的关系以及它们在句子和段落中的作用,并学会通过预测下一个单词序列来回应提示。

「与其争论ai意识与智能水平,何不善假于物呢?」

荀子曰“君子生非异也,善假于物也”。意思是:君子的本性同一般人没有什么差别,但是他们善于借助外物进行学习。其实人类社会中,有很多美好的灵魂都被边缘化,他们就是残障人士,中国总共八千万残疾人,但我们在大街上很少遇到残疾人,即便再高贵的灵魂和自我意识,外在躯体的不方便仍让他们珠玉蒙尘。倘若让ai的外在能力辅助残障人士的生活和工作,岂不是获得共赢。

目前,国内已有团队开始进行这方面的研究。天津理工大学“鲸言创益”无障碍智能科技研发团队用近5年时间,构建视频语料库,研发“复杂场景下中国手语实时翻译系统”。在听障人士打手语的同时,屏幕上就能够自动“翻译”出文字,只为让更多听障人士被“听见”。

无独有偶,上海首个盲人咖啡“种子店”在浦东新区华润时代广场开启试营业。双胞胎兄弟殷天保、殷天佑是两个盲人,但是他们现在已经依靠在线语音识别技术辅助自我在社会上实现了个人价值。

而训练这些ai的语音和自然语言相关的语料,通常由专业数据团队提供,通过更多的数据才能让ai变得更加“smart”。magic data作为一家为众多ai产品提供数据的专业数据采集、标注公司,其中涵盖各个领域与语种的对话数据、自然语言处理数据以及图像数据,其样例如下:

中文人机交互语料库:

广东粤语语料库:点击查看详情

英文车载命令控制语料库:

即刻与 magic data 建立联系?

联系凯发体育网

top
联系凯发体育网
网站地图