9512.net
甜梦文库
当前位置:首页 >> 面试 >>

机器学习和深度学习技能树、面试宝典


光环大数据--大数据培训&人工智能培训 http://hadoop.aura-el.com 机器学习和深度学习技能树、面试宝典_光环大数据培训

人工智能的浪潮正在席卷全球,诸多词汇时刻萦绕在我们耳边:人工智能 (Artificial Intelligence) 、机器学习 (Machine Learning) 、深度学习 (Deep Learning)。

为了帮助大家更好帮助大家学习这些新技术,小遍整理了相关的学习资料, 希望这些资料对刚入门的同行有所帮助。 一、人工智能、机器学习和深度学习的区别?

机器学习:一种实现人工智能的方法

机器学习最基本的做法,是使用算法来解析数据、从中学习,然后对真实世 界中的事件做出决策和预测。 与传统的为解决特定任务、 硬编码的软件程序不同, 机器学习是用大量的数据来 “训练” , 通过各种算法从数据中学习如何完成任务。

举个简单的例子,当我们浏览网上商城时,经常会出现商品推荐的信息。这 是商城根据你往期的购物记录和冗长的收藏清单, 识别出这其中哪些是你真正感 兴趣,并且愿意购买的产品。这样的决策模型,可以帮助商城为客户提供建议并 鼓励产品消费。

机器学习直接来源于早期的人工智能领域,传统的算法包括决策树、聚类、 贝叶斯分类、支持向量机、EM、Adaboost 等等。从学习方法上来分,机器学习 算法可以分为监督学习(如分类问题)、无监督学习(如聚类问题)、半监督学习、 集成学习、深度学习和强化学习。

传统的机器学习算法在指纹识别、基于 Haar 的人脸检测、基于 HoG 特征的

光环大数据 http://hadoop.aura-el.com

光环大数据--大数据培训&人工智能培训 http://hadoop.aura-el.com 物体检测等领域的应用基本达到了商业化的要求或者特定场景的商业化水平, 但 每前进一步都异常艰难,直到深度学习算法的出现。

深度学习:一种实现机器学习的技术

深度学习本来并不是一种独立的学习方法, 其本身也会用到有监督和无监督 的学习方法来训练深度神经网络。但由于近几年该领域发展迅猛,一些特有的学 习手段相继被提出(如残差网络), 因此越来越多的人将其单独看作一种学习的方 法。

最初的深度学习是利用深度神经网络来解决特征表达的一种学习过程。 深度 神经网络本身并不是一个全新的概念, 可大致理解为包含多个隐含层的神经网络 结构。为了提高深层神经网络的训练效果,人们对神经元的连接方法和激活函数 等方面做出相应的调整。其实有不少想法早年间也曾有过,但由于当时训练数据 量不足、计算能力落后,因此最终的效果不尽如人意。

深度学习摧枯拉朽般地实现了各种任务, 使得似乎所有的机器辅助功能都变 为可能。 无人驾驶汽车, 预防性医疗保健, 甚至是更好的电影推荐, 都近在眼前, 或者即将实现。

三者的区别和联系

机器学习是一种实现人工智能的方法, 深度学习是一种实现机器学习的技术。 我们就用最简单的方法——同心圆,可视化地展现出它们三者的关系。

人工智能、机器学习、深度学习三者关系示意图 二、机器学习路线图

光环大数据 http://hadoop.aura-el.com

光环大数据--大数据培训&人工智能培训 http://hadoop.aura-el.com 1)机器学习预备知识:

了解 Python Numpy 模块:Python Numpy Tutorial 学习相关数学基础知识: 了解概率论里的条件概率和贝叶斯定理: 贝叶斯推断及其互联网应 用(一) :定理简介; 了解线性代数中向量、矩阵的基本运算; 了解导数和偏导数运算:微积分求导数的链式法则。

2)机器学习算法工程师技能图

三、深度学习学习技能树

深度学习预备知识:

Deep Learning | Coursera 的 1-3 门课偏理论 翻阅《机器学习》 (周志华 著)前 2 章,了解机器学习的基本概念; 翻阅《数学之美》 (吴军 著) 第 2-5 章,了解自然语言处理的重要概念;

深度学习技能图 四、机器学习算法工程师面试问题

你在研究/项目/实习经历中主要用过哪些机器学习/数据挖掘的算法? 你熟悉的机器学习/数据挖掘算法主要有哪些? 你用过哪些机器学习/数据挖掘工具或框架? 基础知识 无监督和有监督算法的区别? SVM 的推导,特性?多分类怎么处理?

光环大数据 http://hadoop.aura-el.com

光环大数据--大数据培训&人工智能培训 http://hadoop.aura-el.com LR 的推导,特性? 决策树的特性? SVM、LR、决策树的对比? GBDT 和 决策森林 的区别? 如何判断函数凸或非凸? 解释对偶的概念。 如何进行特征选择? 为什么会产生过拟合,有哪些方法可以预防或克服过拟合? 介绍卷积神经网络,和 DBN 有什么区别? 采用 EM 算法求解的模型有哪些,为什么不用牛顿法或梯度下降 法? 用 EM 算法推导解释 Kmeans。 用过哪些聚类算法,解释密度聚类算法。 聚类算法中的距离度量有哪些? 如何进行实体识别? 解释贝叶斯公式和朴素贝叶斯分类。 开放问题 给你公司内部群组的聊天记录,怎样区分出主管和员工? 如何评估网站内容的真实性(针对代刷、作弊类)? 深度学习在推荐系统上可能有怎样的发挥? 路段平均车速反映了路况,在道路上布控采集车辆速度,如何对路 况做出合理估计?采集数据中的异常值如何处理? 如何根据语料计算两个词词义的相似度? 在百度贴吧里发布 APP 广告,问推荐策略? 如何判断自己实现的 LR、Kmeans 算法是否正确?

答题思路

光环大数据 http://hadoop.aura-el.com

光环大数据--大数据培训&人工智能培训 http://hadoop.aura-el.com 用过什么算法? 最好是在项目/实习的大数据场景 里用过,比如推荐里用过 CF、 LR,分类里用过 SVM、GBDT; 一般用法是什么,是不是自己实现的,有什么比较知名的实现,使 用过程中踩过哪些坑 ; 优缺点分析。 熟悉的算法有哪些? 基础算法要多说,其它算法要挑熟悉程度高的说,不光列举算法, 也适当说说应用场合; 面试官和你的研究方向可能不匹配, 不过在基础算法上你们还是有 很多共同语言的,你说得太高大上可能效果并不好,一方面面试官还是要问基础 的,另一方面一旦面试官突发奇想让你给他讲解高大上的内容,而你只是泛泛的 了解,那就傻叉了。 用过哪些框架/算法包? 主流的分布式框架如 Hadoop, Spark, Graphlab, Parameter Server 等择一或多使用了解; 通用算法包,如 mahout,scikit,weka 等; 专用算法包,如 opencv,theano,torch7,ICTCLAS 等。 基础知识 个人感觉高频话题是 SVM、LR、决策树(决策森林)和聚类算法, 要重点准备; 算法要从以下几个方面来掌握 产生背景, 适用场合 (数据规模, 特征维度, 是否有 Online 算 法,离散/连续特征处理等角度) ; 原理推导(最大间隔,软间隔,对偶) ; 求解方法(随机梯度下降、拟牛顿法等优化算法) ; 优缺点,相关改进; 和其他基本方法的对比;

光环大数据 http://hadoop.aura-el.com

光环大数据--大数据培训&人工智能培训 http://hadoop.aura-el.com 不能停留在能看懂的程度,还要 对知识进行结构化整理,比如撰写自己的 cheet sheet,我觉 得面试是在有限时间内向面试官输出自己知识的过程 ,如果仅仅是在面试现场 才开始调动知识、组织表达,总还是不如系统的梳理准备; 从面试官的角度多问自己一些问题, 通过查找资料总结出全面 的解答,比如如何预防或克服过拟合。

开放问题 由于问题具有综合性和开放性,所以不仅仅考察对算法的了解,还 需要足够的实战经验作基础; 先不要考虑完善性或可实现性, 调动你的一切知识储备和经验储备 去设计,有多少说多少,想到什么说什么,方案都是在你和面试官讨论的过程里 逐步完善的,不过面试官有两种风格:引导你思考考虑不周之处 or 指责你没有 考虑到某些情况,遇到后者的话还请注意 灵活调整答题策略 ;

和同学朋友开展讨论,可以从上一节列出的问题开始。

准备建议

基础算法复习两条线 材料阅读包括经典教材 (比如 PRML, 模式分类) 、 网上系列博客 (比 如 研究者 July) ,系统梳理基础算法知识; 面试反馈面试过程中会让你发现自己的薄弱环节和知识盲区, 把这 些问题记录下来,在下一次面试前搞懂搞透 。 除算法知识,还应适当掌握一些系统架构方面的知识,可以从网上分享 的阿里、京东、新浪微博等的架构介绍 PPT 入手,也可以从 Hadoop、Spark 等 的设计实现切入。 如果真的是以就业为导向就要在平时注意实战经验的积累, 在科研项目、 实习、比赛(Kaggle,Netflix,天猫大数据竞赛等)中摸清算法特性、熟悉相

光环大数据 http://hadoop.aura-el.com

光环大数据--大数据培训&人工智能培训 http://hadoop.aura-el.com 关工具与模块的使用。

五、学习建议:

机器学习和深度学习有一定的学习难度,要想在竞争中脱颖而出,就必须做 到

保持学习热情,关心热点; 深入学习,会用,也要理解; 在实战中历练总结; 积极参加学术界、业界的讲座分享,向牛人学习,与他人讨论。

为什么大家选择光环大数据!

大数据培训、 人工智能培训、 Python 培训、 大数据培训机构、 大数据培训班、 数据分析培训、大数据可视化培训,就选光环大数据!光环大数据,聘请大数据 领域具有多年经验的讲师,提高教学的整体质量与教学水准。讲师团及时掌握时 代的技术,将时新的技能融入教学中,让学生所学知识顺应时代所需。通过深入 浅出、通俗易懂的教学方式,指导学生较快的掌握技能知识,帮助莘莘学子实现 就业梦想。

光环大数据启动了推进人工智能人才发展的“AI 智客计划” 。光环大数据专注国内 大数据和人工智能培训,将在人工智能和大数据领域深度合作。未来三年,光环大数据 将联合国内百所大学,通过“AI 智客计划” ,共同推动人工智能产业人才生态建设,培 养和认证 5-10 万名 AI 大数据领域的人才。

光环大数据 http://hadoop.aura-el.com

光环大数据--大数据培训&人工智能培训 http://hadoop.aura-el.com 参加“AI 智客计划” ,享 2000 元助学金!

【报名方式、详情咨询】 光环大数据网站报名:http://hadoop.aura-el.com 手机报名链接:http:// hadoop.aura-el.com /mobile/

光环大数据 http://hadoop.aura-el.com


赞助商链接

更多相关文章:
深度学习初学者,这些东西你必须了解
深度学习初学者,这些东西你必须了解_学习总结_总结/汇报_实用文档。简介 机器学习技术在当代社会已经发挥了很大的作用: 从网络搜索到社交网络中的内 容过滤到电子...
深度学习 vs 机器学习 vs 模式识别_图文
深度学习 vs 机器学习 vs 模式识别 - 本文我们来关注下三个非常相关的概念(深度学习机器学习和模式识别),以及他们与2015年最热门的科技主题(机器人和人工智能)...
人工智能、机器学习和深度学习的区别_图文
人工智能、机器学习和深度学习的区别 - 人工智能、机器学习和深度学习的区别 1.基于激光扫描的混凝土构建变形测试技术 8.基于人工神经网络的激光立体成形件成形表面...
人工智能、机器学习深度学习三者之间的同心圆关系_图文
人工智能、机器学习、深度学习三者 之间的同心圆关系当谷歌 DeepMind 团队的 AlphaGo 打败了李世石时,媒体就用人工智能、机器学习和深 度学习这三个术语来描述 ...
深度学习学习笔记
深度学习”学习笔记摘要:人工智能的飞跃发展得益于深度学习理论的突破以及移动互联网 创造的大数据。本文梳理了人工智能、机器学习深度学习的概念以及 发展历程;...
现代机器学习 基于深度学习的图像特征提取
现代机器学习理论大作业 (基于深度学习的图像特征提取) 基于深度学习的图像特征提取摘要:大数据时代的来临,为深度学习理论的发展创造了良好的条件。本文介绍了深度学习...
现代机器学习-基于深度学习的图像特征提取
现代机器学习-基于深度学习的图像特征提取_数学_自然科学_专业资料。现代机器学习理论大作业 (基于深度学习的图像特征提取) 基于深度学习的图像特征提取 摘要:大数据...
深度学习笔记
深度学习笔记_英语学习_外语学习_教育专区。1,机器...以获取新的知识或技能, 重新组织已有的知识 结构使...(validation set) 3.1 决策树法 机器学习中分类和...
深度学习的研究
深度学习的研究 姓名:21321 班级:231321 学号:564564 学院:机械工程学院 深度学习的发展历史 在解释深度学习之前,我们需要了解什么是机器学习机器学习是人工智能的...
深度学习和大数据
随着机器学习的新领域深度学习的发展, 大大促进了计算机图像识别 的效果,因此未来计算机视觉界的发展前景不可估量。 语音识别 语音识别=语音处理+机器学习。语音识别...
更多相关标签:

All rights reserved Powered by 甜梦文库 9512.net

copyright ©right 2010-2021。
甜梦文库内容来自网络,如有侵犯请联系客服。zhit325@126.com|网站地图