Results 71 to 80 of about 10,394 (164)
Document Clustering and Distributed Representation In E-commerce Text Analysis [PDF]
买家评论文本数据是电子商务领域一种重要的数据形式。利用评论文本数据,通过文本聚类、情感分析等常用的文本挖掘方法,电商卖家可以直接了解顾客对产品的态度与建议,提取顾客关注的热点问题,进行顾客分类、实现精准营销,指导生产和服务等;买家可以提取所关注属性的相关评价,了解舆论情感倾向,提高购物决策效率。但是大数据环境下海量文本的出现给文本数据的有效利用带来了一定的困难,给电子商务文本聚类和情感分析带来了新的挑战。现有的常用文本聚类方法、主题模型等都不能很好地实现海量文本有效信息快速提取 ...
蔡越
core
文中提出了一种基于改进支持向量机的变压器实时热点温度预测方法。该方法以变压器负载电流、环境温度和顶层油温为特征值,将变压器热点温度预警与预测相结合,目的在于实现基于近期历史运行数据的变压器实时热点温度预测。文中研究分析了基于改进网格搜索、遗传算法及粒子群算法的支持向量机在变压器短期热点温度预测中的应用效果,结果表明,3种改进方法均可有效提升预测精度,但基于改进网格搜索算法的支持向量机预测效率最高。最后,以某35 k V油浸式变压器实时热点温度数据为样本集,文中所述方法可有效实现变压器短期热点温度预警预测,
廖才波 +5 more
doaj
Research of Speaker Recognition Based On PLDA Model [PDF]
说话人识别技术,作为现代重要的生物信息识别技术之一,通过对说话人语音样本提取的特征参数进行建模分类,从而分辨说话人身份。目前,NIST(NationalInstituteofStandardsandTechnology)国际评测结果显示,基于PLDA(ProbabilisticLinearDiscriminantAnalysis)模型的说话人识别系统可获得突出的识别效果。然而,现实生活中,语音样本很容易受到环境噪声的干扰,有时候注册语音和待测语音的样本时长是不一致的,甚至 ...
黄玲
core
Outlier detection based on random forest [PDF]
摘要: 提出一种基于随机森林方法的异常样本 (outliers)检测方法。仿真实验表明 ,与其他 2种基于 距离的异常样本检测技术相比 ,这种方法可以更好地提高模型的准确率 ,且具有较强的鲁棒性 ,在处 理大规模数据集时还能显著地减少计算时间。Abstract: It intr oduces an outliers detecti on method based on random forest . Compared with the other t wo common outliers detecti
林成德, 邱一卉
core
Research on Compensation Technology of Pressure Sensor Based on Machine Learning and Intelligent Optimization Algorithm [PDF]
微机电系统(MicroElectroMechanicalSystem,MEMS)拥有功耗低、灵敏度高、体积小、制造标准化程度高以及性价比高等突出优势,基于MEMS制造工艺的压阻式压力传感器被广泛应用于汽车、航空、石油石化及消费电子的压力测量环节。伴随社会工业化水平的不断发展,对相应工业过程的压力测量性能也日趋严格。环境温度和静压压力作为全面影响高精度MEMS压力传感器整体测量特性的两个关键因素,已然成为压阻式压力传感器在高精度测量领域更进一步的瓶颈。 针对上述问题 ...
李冀
core
变压器故障诊断特征信息繁多,且故障点难以确定,为有效利用故障信息提高故障诊断准确率,以及实现故障定位,提出一种基于粗糙集知识和优化支持向量机的变压器分层故障诊断及定位新方法。首先使用邻域粗糙集评估DGA样本重要度,并约简出优选故障诊断特征量。其次构建基于多分类支持向量机的分层故障诊断模型,采用粒子群算法优化模型参数以提高分类精度,实现了故障性质和故障定位的多层诊断。实例分析表明,新特征量可以提高机器学习的知识挖掘能力,不仅故障分类的精度增加,而且模型可以实现故障点的定位,综合诊断准确率达到88.4%。
周光宇, 马松龄
doaj
Research on Feature Extraction for Face Color and Shape Classification for TCM Observation [PDF]
在国务院发布的“中医药发展战略规划纲要(2016—2030年)”的指导下,近年来,我国中医信息处理技术研究开始有了新的发展,中医四诊的客观化与智能化研究也引起了广泛的关注。面诊作为中医临床必察之项,即通过目视观察患者面部状态判断内部脏腑器官的病变情况,主要依赖于医生的主观定性诊断。本文将计算机视觉技术与传统面诊理论结合起来,使用信息技术辅助手段从定量角度对面诊进行客观化研究。 本文所研究的内容围绕面诊领域中人脸颜色和形状特征提取两方面展开,主要工作有以下两项: (1 ...
上官文娟
core
分析断路器的机械振动信号的特性,针对采用单一性质故障特征难以实现整个故障状态空间上准确诊断的局限性,提出了一种基于改进的距离评估技术和多类支持向量机相结合的诊断高压断路器机械故障的方法,该方法由3部分构成:首先从高压断路器机械振动信号中提取时域统计特征、频域统计特征、经验模态分解能量熵及小波包能量特征信息;接着采用改进的距离评估技术从原始特征集合中选取最优特征,实现对原始特征空间的降维处理;最后选取的最优特征量作为"次序二叉树"策略方式的多类支持向量机的输入向量,实现对断路器3种机械故障模式的识别 ...
黄建
doaj
Appli ca ti on of Posteriori Probability SVM in Enterprise Credit Assessment Model [PDF]
摘要:在支持向量机 ( Support Vect orMachine)的分类问题中,训练样本的分类信息总是确定的,由此得到的分类指示函数也总是对新样本给出确定的分类信息,但是这种情况对一些不确定性问题并不恰当。利用贝叶斯规则,将样本的后验概率与传统支持向量机结合,得到了基于后验概率的支持向量机。在具体的算法上,引入了一个经验性的方法得到样本的后验概 率。以某评级机构提供的企业信用评估数据库为研究对象。 ABSTRACT: The classified information of the ...
夏鹏, 李翀
core
提出一种新的支持向量机增量学习算法. 分析了新样本加入训练集后,支持向量集的变化情况. 基于分析结 论提出新的学习算法. 算法舍弃对最终结论无用的样本,使得学习对象的知识得到了积累.
曾文华, 马健
core

