Results 11 to 20 of about 756 (133)
在多标记学习中,属性约简是解决多标记数据维数灾难的一个关键技术.针对邻域粗糙集属性约简在计算正域代价较大和多标记数据中标记具有不同的强弱性问题,提出了基于邻域粗糙集的多标记属性约简算法.该算法首先利用样本在整个属性空间下到其异类样本的平均距离与到其同类样本的平均距离的差值对标记进行加权;其次,利用取整函数对样本空间进行划分,提出了一种新的多标记邻域粗糙集快速计算正域的方法;最后,根据前向贪心搜索算法进行属性约简,以获得一组新的属性排序.实验给出了5个多标记数据集在4个评价准则上的对比结果 ...
刘景华 +3 more
core +1 more source
Incremental Feature Selection Oriented for Data with Hierarchical Structure [PDF]
In the big data era, the sample size is becoming increasingly large, the data dimensionality is also becoming extremely high, moreover, there exists hierarchical structure between different class labels.
SHE Yanhong, HUANG Wanli, HE Xiaoli, QIAN Ting
core +1 more source
随着信息大爆炸时代的到来,数据集的巨大化、数据集结构的复杂化已经成为近似计算中一个不能忽视的问题。动态计算是解决这些问题的一种行之有效的途径。本文对现有的应用于经典多粒度粗糙集动态近似集更新方法进行了改进,提出了应用于变精度多粒度粗糙集的向量矩阵近似计算与更新方法。首先,提出了一种基于向量矩阵的变精度多粒度粗糙集的近似集静态计算算法;其次,重新考虑了变精度多粒度粗糙集近似集更新时的搜索区域,并根据变精度多粒度粗糙集的性质缩小了该区域,这能有效地提升近似集更新算法的时间效率;再次,根据新的搜索区域 ...
于佩秋 +3 more
core +3 more sources
Design and Implementation of Educational Administration Management System Based on Data Mining Technology [PDF]
人们通过数据挖掘技术发现了数据的另一面,对它的认识、分析和使用都到达了另一个高度。数据挖掘技术普遍的使用在各个领域,特别是在金融、互联网等领域高度应用。教育领域具有海量的数据,但是基于数据挖掘的应用基本没有。目前,在各个高校,广泛使用的教务管理系统的主要功能是处理日常事务。在处理日常事务的过程中,会产生大量的数据,这些数据仅仅得到了存储,并没有发挥其内在的功能,即隐藏在数据中的有效信息没有被发现。具体而言,在大批数据中,数据挖掘技术可以发掘影响教学质量和学生成绩的主要因素,并基于主要因素 ...
林彤
core
APPLYING EMGUCV IMAGE PROCESSING LIBRARY IN WPF [PDF]
以一款游戏软件的设计为背景,重点介绍基于C#语言的EMguCV图像处理库在WPf平台的应用实例。软件需要完成对图像的滤波、特征提取、相似度计算、图形匹配等任务,最终实现对输入图形图像的识别功能。图像处理单元使用EMguCV图形图像处理库,它允许人们在C#语言或者.nET框架中使用OPEnCV图像处理库的功能。A game software design is taken as the background,in the article we introduce the application ...
任超, 冯勇建
core
Collaborative filtering recommendation algorithm based on rough set rule extraction [PDF]
To address the problem that in a practical recommendation system (RS),because of the datasets are often very sparse,the traditional collaborative filtering (CF) approach cannot provide recommendations with higher quality,a novel CF based on rough set ...
Yonggong REN +2 more
core +1 more source
Stock Forecasting Based on Multi-variables Hybrid Multi-order Fuzzy Time Series and the Genetic Algorithm [PDF]
中国自1985年发行第一支股票,到股票市场的不断发展和完善,仅用了20多年的时间,这是中国经济改革的辉煌成果。自沪深两个交易所成立以来,我国股票市场高速成长,不断扩大发展,如今在金融市场中占有举足轻重的地位。然而,投资和风险是并存的,股票也不例外。 截至目前,已提出很多股市价格预测的方法,并且随着在股市分析领域中计算机技术应用的扩大和普遍,新的指标分析法也在不断地被提出。 由于股票价格序列符合时间序列的一般特征,而模糊时间序列技术对数据的要求正符合股票数据的特点 ...
万姗红
core
Integrated intrusion detection model based on rough set and artificial immune [PDF]
According to the problems of intrusion detection,an integrated intrusion detection model based on rough set and artificial immune (RSAI-IID) was proposed by using rough set and integrating misuse detection and anomaly detection.The rough set method was ...
Guan-ning CUI +5 more
core +1 more source
Improved Deep Learning Model for Forecasting Short-Term Load Based on Random Forest Algorithm and Rough Set Theory [PDF]
Accurate power load forecasting is conducive to ensuring the safe and economic operation of the power system. Aiming at the problems of low prediction accuracy and long time consuming of the current prediction algorithms, an improved deep learning (DL ...
FENG Jiahuan +6 more
core +1 more source
Rough Sets Based Research on Method of Discretization and Reduction Algorithm [PDF]
粗糙集理论由波兰科学家Z.Pawlak于1982年提出,是继概率论、模糊集理论之后的又一个处理不确定性的数学工具。粗糙集理论建立在论域中的不可分辨关系之上,用上、下近似来描述概念,不依赖于所需处理的数据集合之外的任何先验信息,就能对不精确、不确定、不完整的数据信息进行有效的处理。近年来,粗糙集理论在不少领域如数据挖掘、人工智能、模式识别、决策分析取得了很多成功的应用。 连续数据离散化是粗糙集的重要问题之一。Z.Pawlak提出的以不可分辨关系为核心的粗糙集方法处理的是离散属性值 ...
钱锋
core

