数据

您需要知道的一切!

数据不过是一条信息 。 如果我想了解公司过去6个月的平均销售额,则需要收集一些数据,通过查看这些数据,我可以发现平均销售额的趋势。

数据主要有两种:

  1. 定量的 :当数据以数字形式表示时,例如:身高,体重。 定量数据也称为“变量”,因为值可以更改。
  2. 定性的:当数据不能用数字表示时,例如:宗教,种姓。 定性数据也称为“属性”。
数据类型分类

离散数据:假设,如果我问你“你家有几口人?”,你的答案将是2或3或5或10,等等。这些都是孤立的值。 这种数据称为“ 离散数据 ”。

连续数据:现在,如果我想知道您的身高,您可以通过以下方式回答我:5.8888英尺或6.2222英尺。 因此,您的身高可以在特定范围内(即5和6或6和7之间)取任何值。这是“ 连续数据 ”的一个示例。

离散和连续都属于“ 变量 ”类别。

标称数据有些质量或属性无法比较或无法排序。 例如,眼睛的颜色,头发的颜色,宗教信仰无法排名。 作为个人,您可能有自己的偏好,但是从逻辑上讲,您不能说哪种宗教是最好的。 我们称这种质量为“ 名义”

原始数据:何时可以对质量进行排名。 例如。 如果要求您通过给星星提供以下信息来提供反馈,其中1星星表示“非常差”,2星星表示“差”,3星星表示“好”,4表示“非常好”,5表示“优秀”。 因此,您在这里对这篇文章的质量进行排名。 这就是我们所谓的序数数据。
现在,如果您已经研究过R,那么您可能知道R将某些数据视为“因子”。 因素不过是“ 分类数据 ”。

分类数据分类变量表示可以分为几组的数据类型。 这些组是有限数。 性别是分类变量的一个例子。 如果将性别分为几类,我们将主要得到3个类别:“男性”,“女性”和“其他”。 如果R将任何变量视为因素,并且您检查了该变量的结构,则可以看到该变量的不同级别。 如果要将任何变量转换为因子,可以将其用作。 factor()语法。

如需进一步阅读, 请单击此处

希望您觉得这个有帮助。 我们很快会回来的还有其他有趣的话题。

您是否对数据科学,机器学习,深度学习和协作学习抱有相同的热情! 继续并在此处填写您的详细信息 ,我们将把您添加为中等出版物和StepUp Analytics上的作家。 写作愉快!

当然,不要忘了传播有关我们出版物的信息!

使用StepUp Analytics扩展您的技能

“坚持学习,坚持练习”