计算机如何理解文本语音如果您有兴趣了解更多关于计算机如何理解文本和文本语音的自然语言处理、机器学习应用程序和其他数值算法的信息。您应该查看发布到NVIDIA博客的新教程,其中介绍了如何通过矢量化、散列、标记化和其他技术准备文本。
本文解释了计算机如何使用基本算法将文本转换为向量,以及如何使需要数字输入的算法与文本输入一起工作,从而使开发人员能够创建文本语音应用程序等等。
“自然语言处理(NLP)将机器学习(ML)和其他技术应用于语言。但是,机器学习和其他技术通常适用于表示数据集中每个实例(有时称为观察、实体、实例或行)的称为向量的数值数组。我们称所有这些数组的集合为矩阵;矩阵中的每一行代表一个实例。通过列查看矩阵,每列代表一个特征(或属性)。”
“到目前为止,如果人们不习惯数学语言,这种语言可能看起来相当抽象。然而,在处理表格数据时,数据专业人员已经通过电子表格程序和关系数据库接触过这种类型的数据结构。毕竟,当人们将行视为实例并将列视为特征时,电子表格就是矩阵。例如,考虑一个包含过去和现在员工的数据集,其中每一行(或实例)都有代表该员工的年龄、任期、薪水、资历级别等的列(或特征)。”
标签: