当前位置: 首页 > news >正文

家具展示网站源码网站建设的服务怎么样

家具展示网站源码,网站建设的服务怎么样,做网站电脑开一天用多少钱,建站网站都用不了的0 提纲 噪声相关概述噪声处理的理论与方法基于数据清洗的噪声过滤主动式过滤噪声鲁棒模型1 噪声相关概述 噪声类型: 属性噪声:样本中某个属性的值存在噪声标签噪声:样本归属类别关于噪声分布的假设:均匀分布、高斯分布、泊松分布等。 标签噪声的产生原因: (1)特定类别…0 提纲 噪声相关概述噪声处理的理论与方法基于数据清洗的噪声过滤主动式过滤噪声鲁棒模型1 噪声相关概述 噪声类型: 属性噪声:样本中某个属性的值存在噪声标签噪声:样本归属类别关于噪声分布的假设:均匀分布、高斯分布、泊松分布等。 标签噪声的产生原因: (1)特定类别的影响,在给定的标注任务中,各个类别样本之间的区分度不同,有的类别与其他类别都比较相似,就会导致这类样本标注错误率高。 (2)标注人为的因素。 (3)少数类的标注更容易错误。 (4)训练数据受到了恶意投毒,当在对抗环境下应用机器学习模型时,攻击者往往会通过一些途径向数据中注入恶意样本,扰乱分类器的性能。 噪声标签的影响: 标签噪声比属性噪声更重要数据利用率分类性能下降: k k kNN、决策树和支持向量机、 Boosting 等。模型复杂度 – 决策树节点增多 – 为了降低噪声影响,需要增加正确样本数量 – 可能导致非平衡数据正面影响:Bagging训练数据中的噪声有利于提升基分类器的多样性与噪声类似的概念和研究: 异常离群点:outlier少数类小样本对抗样本恶意样本脏数据2 噪声处理的理论与方法 2.1 噪声处理的理论基础 概率近似正确定理(probably approximately correct,PAC ): 对于任意的学习算法而言,训练数据噪声率 β \beta β,必须满足 β ≤ ε / ( 1 + ε ) β≤ ε /(1+ ε) β≤ε/(1+ε) ,其中 ε ε ε表示分类器的错误率。 2.2 噪声处理的方法概览 基于数据清洗的噪声过滤主动式噪声过滤噪声鲁棒模型3 基于数据清洗的噪声过滤 数据层 去除噪声样本修正噪声样本方法:采用噪声敏感方法检测噪声 – k k kNN, k k k小 – 密度方法 – 决策树 – 集成学习:静态集成、动态集成;投票 – 主动学习:人工+分类器迭代直接删除: 直接删除法是基于两种情况,把异常值影响较大或看起来比较可疑的实例删除,或者直接删除分类器中分类错误的训练实例。在具体实现方法上,如何判断异常值、可疑等特征,可以使用边界点发现之类的方法。基于最近邻的去噪方法: 从 k k kNN本身原理来看,当 k k k比较小的时候,分类结果与近邻的样本标签关系很大。因此,它是一种典型的噪声敏感模型,在噪声过滤中有一定优势。压缩最近邻CNN、缩减最近邻RNN、基于实例选择的Edited Nearest Neighbor等,也都可以用于噪声过滤。集成去噪:集成分类方法对若干个弱分类器进行组合,根据结果的一致性来判断是否为噪声,是目前一种较好的标签去噪方法。两种情况: 使用具有相同分布的其他数据集,当然该数据集必须是一个干净、没有噪声的数据。不使用外部数据集,而是直接使用给定的标签数据集进行 K K K折交叉分析。4 主动式过滤 主动式过滤: 基于数据清洗的噪声过滤方法的隐含假设是噪声是错分样本,把噪声和错分样本等同起来。位于分类边界的噪声最难于处理,需要人工确认。主动学习框架和理论为人类专家与机器学习的写作提供了一种有效的途径,它通过迭代抽样的方式将某种特定的样本挑选出来,交由专家对标签进行人工判断和标注,从而构造有效训练集的一种方法。 查询策略如何选择可能是噪声的样本,就成为主动学习的核心问题。 查询策略主要可以分为以下两类: 基于池的样例选择算法;基于流的样例选择算法。基于池的样本选择算法代表性的有: 基于不确定性采样的查询方法;基于委员会的查询方法;基于密度权重的方法等。不确定性采样的查询:将模型难于区分的样本提取出来,具体在衡量不确定性时可以采用的方法有最小置信度、边缘采样和熵。 x L C ∗ = argmax ⁡ x ( 1 − P θ ( y ^ ∣ x ) ) = argmin ⁡ x P θ ( y ^ ∣ x ) x_{L C}^{*}=\operatorname{argmax}_{x}\left(1-P_{\theta}(\hat{y} \mid x)\right)=\operatorname{argmin}_{x} P_{\theta}(\hat{y} \mid x) xLC∗​=argmaxx​(1−Pθ​(y^​∣x))=argminx​Pθ​(y^​∣x) 边缘采样是选择哪些类别概率相差不大的样本: x M ∗ = argmin ⁡ x ( P θ ( y ^ 1 ∣ x ) − P θ ( y ^ 2 ∣ x ) ) x_{M}^{*}=\operatorname{argmin}_{x}\left(P_{\theta}\left(\hat{y}_{1} \mid x\right)-P_{\theta}\left(\hat{y}_{2} \mid x\right)\right) xM∗​=argminx​(Pθ​(y^​1​∣x)−Pθ​
http://mrfarshtey.net/news/8065/

相关文章:

  • 爱网站在线观看免费wordpress电视直播插件
  • 学网站美工设计个人博客系统源码
  • 企业网站模板下载哪里好杭州定制网站公司
  • 网站公司开发网站开发工作介绍
  • 扬州市市政建设处网站查找公司信息的网站
  • 网站开发者yotoon各大免费推广网站
  • 医院网站设计模板青少年编程培训哪家好
  • 东营网站建设关键字排名问题平台网站建设公司哪家好
  • 网站维护 如何收费深圳外贸建站与推广
  • 免费申请域名建立网站网上国网推广经验
  • 怎么接网站来做wordpress 定时生成首页静态
  • 做网站销售的扬中网站哪家做得好
  • 龙岗商城网站建设最好网站付费推广有哪些
  • 网站建设跟加入会员哪个效果好哪个网站可以做照片分享
  • 深圳工程交易中心官网网站排名优化电话
  • 网站开发实习个人小结网站制作工作流程
  • 10个网站《语文建设》网站
  • 洛阳做网站的公司哪家好网站建设公司首选
  • 网上商城网站建设意义外贸公司取名字大全集
  • 河南网站建设企业添加网站描述
  • 揭阳市榕城区建设局网站建设网站号码
  • wordpress如何安装网站主题虎丘网站建设
  • 给平面设计素材网站做素材挣钱吗公司推广业务哪个平台好
  • 汽车用品网站织梦模板官网
  • 酒店设计网站推荐百度移动开放平台
  • 淘宝网站开发实训报告目录手机发博客wordpress
  • dedecms做的网站首页被挂马广告网眼布
  • 龙岩做网站开发哪家做的好厦门公司注册程序注册程序
  • 响应式布局网站商丘网络营销公司
  • 定安网站制作百度云引擎搜索