Results 101 to 110 of about 6,023 (236)
Classification of Gene Expression Data Based on Dimension Reduction [PDF]
利用基因芯片技术能够做到同时对多到数以万计的基因进行并行分析,随着该技术越来越成熟并得到广泛应用,现在已经有越来越多的基因表达数据测定出来,亟需处理,借助于计算机工具以及机器学习方法对这些大量数据进行分析是现在一个很重要的研究领域。其中,基因表达数据的分类研究是该领域的一个热点,通过分类能够帮助研究者发现正常细胞组织与疾病组织之间基因的本质差异,识别致病基因,对基因型疾病的临床诊断和治疗具有重要的意义。 基因表达数据具有“样本少、维数高、分布不平衡”的特点,这给分类带来了很多的困难和挑战 ...
李亮亮
core
Document Clustering and Distributed Representation In E-commerce Text Analysis [PDF]
买家评论文本数据是电子商务领域一种重要的数据形式。利用评论文本数据,通过文本聚类、情感分析等常用的文本挖掘方法,电商卖家可以直接了解顾客对产品的态度与建议,提取顾客关注的热点问题,进行顾客分类、实现精准营销,指导生产和服务等;买家可以提取所关注属性的相关评价,了解舆论情感倾向,提高购物决策效率。但是大数据环境下海量文本的出现给文本数据的有效利用带来了一定的困难,给电子商务文本聚类和情感分析带来了新的挑战。现有的常用文本聚类方法、主题模型等都不能很好地实现海量文本有效信息快速提取 ...
蔡越
core
随着科技的飞速发展,机器学习已经成为推动企业进步的关键因素。然而,对于中小企业而言,数据量和算力的限制常常成为其应用机器学习的障碍。算力网络的兴起则为企业带来了新的机遇,但也伴随着数据安全等新的挑战。提出一种面向算力网络的多用户安全协同计算线性回归方案,该方案允许多个用户使用敏感数据在算力网络中实现安全的联合训练,从而构建线性回归模型。该方案采用低成本盲化手段与同态加密技术对用户敏感数据进行加密处理,从而保护了敏感数据的安全性。
潘洁, 侯慧芳, 陈曦, 薛曌, 徐连坤
doaj +1 more source
[Application and prospect of machine learning in orthopaedic trauma]. [PDF]
Tian C+5 more
europepmc +1 more source
Remote sensing of the extent of the Bohai sea ice and temperature anomaly of ocean interior during recent global surface warming hiatus [PDF]
自1998年起,全球表面出现增暖减缓,全球气候处在深度调整中。我国近岸对此出现不同程度的响应,极端海洋灾害事件频发。2009-2010年冬季,受北方持续寒潮的影响,渤海出现了历史罕见的严重海冰冰情,海冰成为2010年中国海洋主要灾害之一。通过冰冻区遥感影像分类准确有效地提取海冰分布信息对于检测和评估海冰演化过程是至关重要的。我们提出一种新的基于融合多特征的机器学习影像分类技术,有效地用于MODIS冰冻区影像分类及海冰分布范围估算。通过灰度共生矩阵(GLCM)纹理特征分析提取MODIS影像纹理特征 ...
苏华
core
基于支持向量机的结构损伤识别方法建立在训练和测试数据同概率分布的假设上,必须对每个结构分别收集训练数据和标签并训练模型以识别损伤。损伤结构的训练数据和标签难以收集,导致支持向量机方法在结构损伤识别中难以实施。提出一种基于领域自适应支持向量机的跨域损伤识别方法,将在有损伤标签结构(源结构)上训练的支持向量机推广到无损伤标签结构(目标结构)的损伤识别中。该方法首先提取结构的多阶固有频率变化率作为损伤特征构建训练数据;然后,推导最小化边缘分布差异与最小化联合分布差异的迁移学习方法 ...
李佐强+6 more
doaj
传统Bootstrap抽样和Bagging集成学习通常以串行方式实现,计算效率低,且存在样本不可重用、扩展性差等问题,不适合高效的大规模Bagging集成学习。从大数据分布式计算的思维入手,提出新的Bootstrap样本划分(BSP)大数据模型和分布式集成学习方法。BSP数据模型通过分布式生成算法将训练数据表达成分布式Bootstrap样本集的集合,存储成HDFS分布式数据文件,为后续的分布式集成学习提供数据支持。分布式集成学习方法从BSP数据模型中随机选取多个BSP数据块,读入集群各个节点的虚拟机 ...
罗凯靖, 张育铭, 何玉林, 黄哲学
doaj +1 more source
在基于脑电信号的情感检测过程中,受被试间脑电信号的差异影响,传统的机器学习和深度学习方法不能很好地针对脑电数据建立通用的分类检测模型。针对此问题,将每个被试看作独立的域,建立针对脑电数据的多源域自适应的跨被试情感脑电识别模型,并在公开数据集上进行验证。验证结果表明,与单源域模型相比,提出的模型有更好的跨被试特征提取及分类能力。
高寒冰+4 more
doaj