根据一项新的研究,从出生到18岁之间的语言习得是一种非凡的认知能力,而不是人类硬性要做的事情。
研究人员计算出,从婴儿期到成年,学习者大约吸收1250万位有关语言的信息(每分钟约2位),以完全获得语言知识。
研究发现,如果将其转换为二进制代码,数据将填满1.5 MB的软盘。
“……儿童和青少年是杰出的学习者,每天吸收多达1000比特的信息。”
这项发现发表在《 皇家学会开放科学 》杂志上,挑战了以下假设:人类语言习得不费吹灰之力,并且机器人将很容易掌握它。
研究高级作者史蒂芬·皮安塔多西(Steven Piantadosi)说:“我们的研究是第一个对您学习语言的数量进行统计的研究。”
“它突显出儿童和青少年是杰出的学习者,每天吸收多达1000比特的信息。”
例如,当学习“火鸡”一词时,年轻的学习者通常会通过询问“火鸡是鸟吗?”来收集一些信息。 是还是不是? 土耳其会飞吗? 是的,还是否?”等等,直到掌握了“土耳其”一词的全部含义。
位或二进制数字是计算中数据的基本单位,计算机存储信息并仅使用零和一进行计算。 该研究使用8位到一个字节的标准定义。
“当您想到一个孩子必须记住数以百万计的零和一(在语言上)时,那说明他们必须具有非常令人印象深刻的学习机制,” Piantadosi说。
“……语法只代表一小部分语言学习……”
研究人员试图评估说英语的人学习其母语所需要的数量和各种信息。 他们通过计算模型运行有关语言语义和语法的各种计算来得出结果。 值得注意的是,该研究发现语言知识主要集中在单词的含义上,而不是语言的语法上。
“关于语言学习的很多研究都集中在语法上,例如单词顺序,” Piantadosi说。 “但是我们的研究表明,语法只是语言学习的一小部分,而主要困难必须在于学习这么多单词的含义。”
对语义与语法的关注使人与机器人(包括语音控制的数字助手,例如Alexa,Siri和Google Assistant)区别开来。
“这确实凸显了机器学习者与人类学习者之间的区别,” Piantadosi说。 “机器知道哪些单词组合在一起以及它们在句子中的位置,但是对单词的含义却一无所知。”
相关:诵读困难的语言麻烦是大脑中错误的“阅读网络”
关于双语者是否必须存储两倍的信息量的问题,Piantadosi说,在单词含义的情况下这不太可能,因为其中的许多单词含义是跨语言共享的。
他说:“诸如母亲之类的许多常见名词的含义在各种语言中都是相似的,因此您无需两次学习所有有关其含义的信息。”
Piantadosi的合著者Francis Mollica来自罗切斯特大学。
资料来源: 加州大学伯克利分校的 Yasmin Anwar
原始研究DOI:10.1098 / rsos.181393
在 Futurity.org上 找到更多研究新闻