《Spark机器学》是一本由彭特里思 (Nick Pentreath)著作,邮电出版社出版的平装图书,本书定价:CNY 59.00,页数:224,特精心从网络上整理的一些读者的读后感,希望对大家能有帮助。
《Spark机器学》读后感(一):Spark机器学
我看过了 我看过了 我看过了 我看过了 我看过了 我看过了 我看过了 我看过了 我看过了 我看过了 我看过了 我看过了 我看过了 我看过了 我看过了 我看过了 我看过了 我看过了 我看过了 我看过了 我看过了 我看过了 我看过了 我看过了 我看过了 我看过了 我看过了 我看过了 我看过了 我看过了
《Spark机器学》读后感(二):简单粗货多
正如这本书的前言所说,这本书“注重技术实际”,预备知识是“已有基本的scala、java或python编程基础以及机器学、统计学和数据分析方面的基础知识”。所以书里面对语言的学和机器学的理论介绍很少,也很简洁。要是细节太多,作者直接简单粗暴地让你参考《spark编程指南》,也就是官方文档。
后面全是实例,挺不错。代码解释的很清楚,而且对整个工业界机器学的应用有系统的说明。这本书给我最大的惊喜就是,书里面很多python代码,而不是通篇的scala代码。作为一个scala小白,看到很多地方把python和scala代码写在一起,对后面理解scala也大有裨益。
综上所述,这本书最大的特点就是简单粗暴,干货多。看完即用,用完即扔。
《Spark机器学》读后感(三):读Scala机器学
首先再次感谢大数据公众平台给我一次学的机会,让我有幸能够读到《Scala机器学》这本IT名著。在此我要预祝大数据公众号越办越好。
本人研究生智能计算及其应用方向,主修机器学和人工智能,虽然自知智力有限,但仍不放弃对该领域的热爱。言归正传,浅谈我对这本书的感受和收获。当时之所以要申请试读这本书,是因为我个人非常看好机器学方面和分布式平台方面的技术,而众所周知Spark源码是由Scala写的,当然其也提供了JAVA API和Python API,所以我希望多了解一些分布式平台上的机器学算法的实现问题,作为一个科班出身的学生不能只懂得调用MLlib,而更要理解其基本实现原理和实现方式,也是对自己思维和能力上的进一步提升,说道这再一次感谢平台给我的这次机会(#^.^#)。
目前,无论是百度、阿里或是谷歌的科技巨头,还是其他科技公司,都在进军人工智能市场,而机器学作为人工智能的一分也(这里解释一下,机器学是人工智能的一个邻域,而网络模型是机器学中的某一技术,所以称网络模型为人工智能是不太准确的)日渐发挥重大作用。
由于本活动规定要在2周之内看完全书,时间较为仓促,我看完一遍后对整本书有了大致的了解。第1章是数据探索分析。第2章介绍数据管道和建模。这两章讲的基础概念比较多,对这些概念要理解清晰,尤其是对那些相近的定义,一定要界定清楚。第3章讲了Spark与MLlib的安装与使用,过程很详细,可以根据步骤逐一实现其中的几个小例子。第四章主要针对Iirs数据集分别应用SVM、logistic回归、决策树和集成学进行分类。第五章精准的讲解了回归与分类的定义和两者的区别和联系,针对模型过拟合问题引入的正则化项等。第六章讲述对非结构化数据的处理方式和用途。第七章借助spark平台实现图算法的计算,包括经典的PageRank的实现、奇异值分解等。第八章主要讲解如何将scale和python进行集成。第九章为scala借助MLlib进行自然语言处理,其中包括计算文档的TF-IDF、LDA等。第十章为高级模型监控,偏系统模型,可以作为理解的内容。
通过参加这次试读活动,我应用scala完成机器学有了更深的了解。非常感谢本次活动的主办方,希望以后有更多这样有意义的活动!
《Spark机器学》读后感(四):Spark机器学视频
深入浅出Spark机器学实战(用户行为分析)
课程观看地址:http://www.xuetuwuyou.com/course/144
课程出自学途无忧网:http://www.xuetuwuyou.com
一、课程目标
熟练掌握SparkSQL的各种操作,深入了解Spark内实现原理
深入了解SparkML机器学各种算法模型的构建和运行
熟练Spark的API并能灵活运用
能掌握Spark在工作当中的运用
二、适合人群
适合给,有java,scala基础,想往大数据spark机器学这块发展
适合给想学spark,往数据仓库,大数据挖掘机器学,方向发展的学员
三、课程用到的软件及版本:
ark2.0,Spark1.6.2,STS,maven,Linux Centos6.5,mysql,mongodb3.2
四、课程目录:
课时1:Spark介绍
课时2:Spark2集群安装
课时3:Spark RDD操作
课时4:SparkRDD原理剖析
课时5:Spark2sql从mysql中导入
课时6:Spark1.6.2sql与mysql数据交互
课时7:SparkSQL java操作mysql数据
课时8:Spark统计用户的收藏转换率
课时9:Spark梳理用户的收藏以及订单转换率
课时10:最终获取用户的收藏以及订单转换率
课时11:Spark Pipeline构建随机森林回归预测模型
课时12:Spark 随机森林回归预测结果并存储进mysql
课时13:Spark的决策树算法实现收藏转换率预测
课时14:Spark机器学各种分类算法介绍
课时15:Spark机器学协同过滤算法,构建用户与产品模型
课时16:Spark协同算法完成给用户推荐产品。
课时17:Spark与mongodb整合
课时18:Spark的随机森林算法预测产品收藏购买结果存储进mongodb
课时19:Spark操作RDD需要注意点,以及Spark资源参数调优
课时20:Spark整个学过程及其总结
《Spark机器学》读后感(五):**********《大数据数据分析与挖掘高级工程师》课程资源下载Spark**********
大数据数据分析与挖掘高级工程师 资源下载:https://pan.b网友du.com/s/1rgMb1MAz-RDV4LGe9xJr-A
1、Level Ⅰ业务数据分析师
1、Excel必备常用工具使用与高级技巧
2、MySQL数据库
3、SPSS Modeler数据挖掘
4、数据挖掘分析师之软技能 数据分析入门
5、数据挖掘分析师之软技能 - 实战需求分析
6、数据挖掘分析师之软技能 - 实战竞品分析
7、数据挖掘分析师之软技能 - 实战产品规划与设计
8、Tableau商业智能与可视化应用实战
9、Echarts从入门到上手实战
2、Level Ⅱ建模分析师
1.实用型大数据挖掘算法
2.SPSS Modeler数据挖掘项目实战
3.Python 新手扫盲
4.实战基于Python的网络爬虫技术
5.R语言数据挖掘和分析
6.实战机器学(基于Python)
7.零基础实战机器学
8.大数据挖掘分析师之硬技能 - 基于金融行业的大数据挖掘分
9.Python2基础+数据分析
10.python3基础编程
3、Level Ⅲ大数据分析师
1、大数据挖掘分析师之硬技能 - Java语言基础
2、大数据挖掘分析师之硬技能 - 大数据必备的数据结构与算法
3、大数据挖掘分析师之硬技能 - Linux必知必会
4、大数据挖掘分析师之硬技能 - Hadoop大数据技术入门
5、基于Hadoop技术实现的离线电商分析平台
4、Level IV数据分析专家
1、数据分析专家之软技能 - 卓越的项目管理应用与实践
2、数据分析专家之软技能 - 大道至简之软件从设计到编码全程
3、数据分析专家之软技能 - 系统架构设计的原理、核心技术与案例分析
4、数据分析专家之硬技能 - Spark基础--快学Scala8
5、数据分析专家之硬技能 - 大数据Spark从入门到精通
6、数据分析专家之 BI 扩展技能 - 高端微软BI商业智能实战
7、数据分析专家之 BI 扩展技能 - 中小型企业商业智能平台
8、MySQL和Oracle两大数据库
拓展课程
MSSQL、MySQL、Oracle 主流数据库快速上手
驴妈妈旅游网大型离线数据电商分析平台
某团购网大型离线电商数据分析平台
数据可视化工具之Tableau
拓展课程目录.xlsx
答疑录屏
课程进度安排表
数据分析阶段测试
资料与作业