高维数据分析预处理技术在线阅读
会员

高维数据分析预处理技术

祝琴
开会员,本书免费读 >

计算机网络数据库6.4万字

更新时间:2022-05-26 20:18:44 最新章节:内容简介

立即阅读
加书架
下载
听书

书籍简介

作者针对高维稀疏数据挖掘问题,从数据预处理的角度,研究对象—属性空间的划分问题,其目的是把所研究的数据挖掘空间分解为若干规模较小的对象:属性空间,从而降低实际数据挖掘的难度。本书针对高维稀疏数据挖掘问题,以降低数据挖掘规模,建立了体系完整的数据预处理理论和方法,具有很强的理论意义和实际应用前景。
上架时间:2015-12-01 00:00:00
出版社:社会科学文献出版社
上海阅文信息技术有限公司已经获得合法授权,并进行制作发行

最新章节

祝琴
主页

最新上架

  • 会员
    本书以Python数据分析与挖掘的常用技术与真实案例相结合的方式,深入浅出地介绍Python数据分析与挖掘的重要内容。本书共11章,分为基础篇(第1~5章)和实战篇(第6~11章),基础篇包括数据挖掘基础、Python数据挖掘编程基础、数据探索、数据预处理、数据挖掘算法基础等基础知识;实战篇包括6个案例,分别为信用卡高风险客户识别、餐饮企业菜品关联分析、金融服务机构资金流量预测、O2O优惠券使用预
    翟世臣 张良均主编计算机13.6万字
  • 会员
    高质量的数据关乎企业运营、合规、决策和业绩的关键,哈佛商业评论的一项研究发现,企业中只有3%的数据符合质量标准,绝大多数公司都在寻求切实可行的指导来提高数据质量。本书作者基于多年在数据、数据分析和人工智能方面的实践经验,阐述了4步构建高质量数据体系。他提出了高质量数据的四阶段DARS方法(定义、评估、实现、持续)和10个数据质量最佳实践案例,以此来提高业务中的数据质量水平,为业务提供数据价值,保证
    (美)普拉桑特·苏特卡尔计算机11.7万字
  • 会员
    这是一本站在一线开发人员的视角,从SQL的本质出发,采用理论与实践相结合、案例与分析相结合、作者经验与一线需求相结合的方式,深度解读大数据SQL优化核心技术和解决方案的工具书。本书主要面向大数据初中级技术人员,期望帮大家深度理解大数据SQL优化原理,掌握SQL优化的落地实践方法,从而真正“玩转”大数据SQL优化技术,根据实际问题和需求设计出有针对性的提升SQL性能的解决方案。
    陈鹤 杨国栋计算机14万字
  • 会员
    《SQLServer从入门到精通(第5版)》从初学者角度出发,通过通俗易懂的语言、丰富多彩的实例,详细介绍了SQLServer开发所必需的各方面技术。全书分为4篇共19章,内容包括数据库基础、SQLServer数据库环境搭建、创建与管理数据库、操作数据表、SQL基础、SQL函数的使用、SQL数据查询基础、SQL数据高级查询、视图的使用、存储过程、触发器、游标的使用、索引与数据完整性、SQL中
    明日科技编著计算机14.1万字
  • 会员
    《数据分析实践:专业知识和职场技巧》从初学者的角度出发,讲解了进阶为高级数据分析师所需的知识和技能,其中既包括数据分析岗位的介绍、发展现状及未来趋势,也包括实际工作中各环节的方法策略、实战案例,还包括职场中的困惑解答及面试指导。阅读本书,并基于本书进一步拓展所需要的知识能,可以帮助读者形成一套成系统、可实战的数据分析方法论。
    姜文哲计算机19.6万字
  • 会员
    MySQL数据库是目前全球流行的数据库之一。《MySQL8.0从入门到实战》从入门到实战,系统全面、由浅入深地介绍MySQL数据库应用的各个方面。全书分为8个部分,共18章。第1部分(第1~3章)介绍MySQL的基础知识,包括初识MySQL、数据库设计和数据类型;第2部分(第4~6章)介绍MySQL的基本操作,包括SQL基础操作、MySQL连接查询和数据复制、MySQL基础函数;第3部分(第7、8
    张文亮编著计算机9.7万字
  • 会员
    本书是《数据库原理——GaussDB技术及应用》一书配套的辅助教材。全书共分3部分:第一部分为实验指导,共有13个综合实验,每一个实验都是根据教学目标而设计,详细讲述了每一个实验的实验目的、实验任务及实验步骤,从而培养学生掌握关系数据库管理软件技术与应用的技能;第二部分为习题集,是根据主教材各章节内容编写的习题及习题答案,内容广泛,有填空、选择、简答、设计及实验题等多种形式,利求通过对这些习题的训
    李雁翎编著计算机6.9万字
  • 会员
    本书以案例的形式,介绍从思维模型分析到场景实践的数据分析方法。全书围绕“数据分析”与“运营增长”两大关键要素,在系统介绍数据分析思维、数据分析方法、数据采集技能、数据清洗技能等基础知识的同时,以问题为导向,解读运营与增长的关键性业务内容,在获客、激活、留存、变现、自传播循环等各个核心运营环节展开数据分析实战。本书提供案例相关数据集与源码包,适合数据分析、产品运营、市场营销等行业有数据分析具体业务需
    黄佳计算机12万字
  • 会员
    《企业级大数据项目实战:用户搜索行为分析系统从0到1》基于真实业务场景,以项目导向为主线,从0到1全面介绍企业级大数据用户搜索行为分析系统的搭建过程。全书共6章,第1章讲解项目需求与架构设计,详细阐述项目数据流与系统架构;第2章介绍大数据项目开发环境配置,手把手带领读者配置操作系统、Hadoop集群与相关工具,为后续项目实施打下基础;第3~5章逐步实现项目需求,第3章讲解用户行为数据采集模块的开发
    张伟洋计算机9万字

同类书籍最近更新

  • 会员
    本书介绍了数据网格——一种来自现代分布式架构的去中心化社会技术范式,它提供了一种大规模采购、共享、访问和管理分析型数据的新方法。本书分为五部分。第1部分介绍DataMesh的四个原则,以及它们所组成的高级模型。第二部分比较DataMesh与以前的数据架构的区别。第三部分介绍DataMesh组件的高层次架构,帮助你设计DataMesh架构以及评估与DataMesh匹配的现成技术。第四部分介绍Data
    (澳)扎马克·德加尼数据库18.1万字
  • 会员
    高效测试平台的建设对软件自动化测试的效率有重大的意义。本书总结了高效测试平台的基本设计方法,包括面向对象设计思想、模块化设计、可扩展的弹性设计、测试设备的驱动设计、与CI/CD的结合,以及平台的部署。介绍了如何进行测试工具的选型、测试引擎的灵活配置,如何开发高复用性的测试用例,如何进行测试用例的生命周期管理等。此外,与平台相结合,深入探讨了数据驱动测试、事件驱动测试等测试脚本的设计模式、代码自动生
    徐德晨 茹炳晟数据库17.9万字
  • 会员
    本书结合数据科学的具体应用场景,由浅入深、循序渐进地引导读者入门数据科学,覆盖了数据获取、数据预处理、数据分析等方面的内容,共10章。本书首先概括性地介绍各章的主要内容,然后通过一个个生动的案例讲解数据获取、数据预处理、自然语言处理、机器学习和深度学习等方面的典型应用,最后通过答疑部分为读者提供进一步学习的方向和方法的建议。本书各章的案例均基于具体应用场景,以简单、清晰的方式对数据科学相关的技术原
    王树义 翟羽佳数据库13.8万字
  • 会员
    Oracle是目前全球应用最广泛、功能最强大的关系型数据库。本书结合大量实例,详细地讲述了Oracle数据库各方面的知识。全书内容包括Oracle安装配置、Oracle常用开发工具、SQLPlus、数据表、视图、约束、函数与存储过程、触发器、序列、索引、用户与角色、内置函数、控制语句、SQL查询及更新语句、并发与锁定、正则表达式、与编程语言结合使用。为了便于读者学习与把握,在每章都使用了单独的小
    张朝明 陈丹编著数据库18.9万字
  • 会员
    本书是国家社会科学基金重大项目“数据赋能激励制造业企业创新驱动发展及其对策研究(18ZDA062)”的成果,是研究团队近几年在企业数字化领域的研究总结与升华,是集体智慧的结晶,由张振刚和罗泰晔共同制定全书写作提纲、提出编写思路、构建概念框架、确定并撰写具体内容,以及组织团队成员开展编写工作。
    张振刚 罗泰晔编著数据库19.5万字
  • 会员
    本书的主角是在大数据时代应运而生的数据处理与分析利器——Spark。你将通过丰富的示例学习如何使用Spark的结构化数据API,利用SparkSQL进行交互式查询,掌握Spark应用的优化之道,用Spark和DeltaLake等开源工具构建可靠的数据湖,并用MLlib库实现机器学习流水线。随着Spark从2.x版本升级到3.0版本,本书第2版做了全面的更新,以体现Spark生态系统在机器学习、
    (美)朱尔斯·S. 达米吉 布鲁克·韦尼希 丹尼·李 (印)泰瑟加塔·达斯数据库14.7万字