欢迎来到江苏蓝创智能科技股份有限公司官网! 设为首页 加入收藏
  • 数据集成与服务

  • 咨询热线
  • +86-510-85126279
  • 关于我们
    • 蓝创介绍
    • 新闻资讯
    • 蓝创分享
    • 联系我们MORE >>
    • 江苏蓝创智能科技股份有限公司
        电话:0510-85126279
        传真:0510-85128069
        地址:无锡市蠡湖大道2018号蓝创智能大楼
      • 数据挖掘---数据

        数据集可以看成是数据对象的集合,数据对象简单理解就是一组对象属性,而属性我们也可以称为变量,特性,字段或维,属性类型包括Nominal (名词性),Numberic(数值),当然还可以细分。

        1、数据集

        我们挖掘的数据集有好多种比如:

        1)记录数据: 记录数据就是一条一条记录的汇集,每条记录包含固定的数据字段集,这种记录文件通常存放在关系数据库中。

        a:Transaction(事务数据): 它是一种特殊类型的记录数据,其中每个记录(事务)涉及一系列的项,如购物篮数据,每一行代表一位顾客的购买商品:

        数据集可以看成是数据对象的集合,数据对象简单理解就是一组对象属性,而属性我们也可以称为变量,特性,字段或维,属性类型包括Nominal (名词性),Numberic(数值),当然还可以细分。

        1、数据集

        我们挖掘的数据集有好多种比如:

        1)记录数据: 记录数据就是一条一条记录的汇集,每条记录包含固定的数据字段集,这种记录文件通常存放在关系数据库中。

        a:Transaction(事务数据): 它是一种特殊类型的记录数据,其中每个记录(事务)涉及一系列的项,如购物篮数据,每一行代表一位顾客的购买商品:


        一般来说,特征子集是搜索所有可能的特征子集过程,可以使用多种搜索策略,但是搜索的一个不可或缺的步骤就是评估步骤,根据已经考虑的子集评估当前 的特征子集,因为我们穷举特征子集需要很多时间,所以一般有个停止判断用于结束选取特征过程(比如迭代次数...)

        特征提取(feature extraction)

        由原始的数据创建新的特征集,比如说照片原始特征属性是像素的集合,但是这种特征不适合很多分类算法,因此我们通过对这些像素数据进行处理,提取一些较高层次的特征,比如图像边等,就可以很好的使用一些算法用于分析这些特征。