注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

Koala++'s blog

计算广告学 RTB

 
 
 

日志

 
 

Machine Learning vs. Statistics  

2009-10-17 20:06:52|  分类: 机器学习 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

I was recently pointed to a very amusing comparison by the excellent statistician — and machine learning expert — Robert Tibshiriani. Reproduced here:

       我现在给出一个非常有趣的对比,由一个杰出的统计学家,和机器学习专家,Robert Tishiriani

Glossary

Machine learning

Statistics

network, graphs

model

weights

parameters

learning

fitting

generalization

test set performance

supervised learning

regression/classi?cation

unsupervised learning

density estimation, clustering

large grant = $1,000,000

large grant = $50,000

nice place to have a meeting:
Snowbird, Utah, French Alps

nice place to have a meeting:
Las Vegas in August

 

术语 Glossary

机器学习 Machine learning

统计 Statistics

网络,图network, graphs

模型model

权重weights

参数parameters

学习learning

拟合fitting

泛化generalization

测试集效果test set performance

监督学习supervised learning

回归/分类regression/classi?cation

无监督学习unsupervised learning

密度估计,聚类density estimation, clustering

大的学术基金 $1,000,000

large grant = $1,000,000

大的学术基金 $500,000

large grant = $50,000

开会的好地方:

Snowbird,犹他,法国阿尔卑斯

nice place to have a meeting:
Snowbird, Utah, French Alps

开会的好地方:

八月的拉斯维加斯

nice place to have a meeting:
Las Vegas in August

 

Tom MitchellThe Discipline of Machine Learning。想不到他竟然认为机器学习是统计与计算机的结合。

Machine Learning is a natural outgrowth of the intersection of Computer Science and Statistics. We might say the defining question of Computer Science is “How can we build machines that solve problems, and which problems are inherently tractable/intractable?” The question that largely defines Statistics isWhat can be inferred from data plus a set of modeling assumptions, with what reliability?” The defining question for Machine Learning builds on both, but it is a distinct question. Whereas Computer Science has focused primarily on how to manually program computers, Machine Learning focuses on the question of how to get computers to program themselves (from experience plus some initial structure). Whereas Statistics has focused primarily on what conclusions can be inferred from data, Machine Learning incorporates additional questions about what computational architectures and algorithms can be used to most effectively capture, store, index, retrieve and merge these data, how multiple learning subtasks can be orchestrated in a larger system, and questions of computational tractability.

机器学习是计算机科学与统计学的自然交集。我们可以说计算机科学关键问题(原文指的是The central question it studies)是:我们如何设计一个解决问题本身容易处理/难以处理的机器。关于统计的关键问题是:可以从数据和一堆模型假设中我们可以得到什么,有多少的可信度。机器学习的关键问题产生这两者,但它是一个不同的问题,计算机科学大部分关注于如何手工编程,而机器学习关注于让计算机自己编程(从经验和一些初始的结构),同时统计主要关注于从数据中可以得出什么结论,机器学习集成了其它的问题。

 

       周志华博客里的一篇文章,只选三段,也不想为这种事打扰大师。其它的到他的Blog里看吧(http://zhouzh2009.spaces.live.com/blog/cns!8417995FC7F447A4!189.entry):

这群人可能对统计学习目前dominating的地位未必满意。靠统计学习是不可能解决人工智能中大部分问题的,如果统计学习压制了对其他手段的研究,可能不是好事。这群人往往也不care在文章里show自己的数学水平,甚至可能是以简化表达自己的思想为荣。人工智能问题不是数学问题,甚至未必是依靠数学能够解决的问题。人工智能中许多事情的难处,往往在于我们不知道困难的本质在哪里,不知道“问题”在哪里。一旦“问题”清楚了,解决起来可能并不困难。

慢慢地,不少统计学家逐渐意识到,统计学本来就该面向应用,而机器学习天生就是一个很好的切入点。因为机器学习虽然用到各种各样的数学,但要分析大量数据中蕴涵的规律,统计学是必不可少的。统计学出身的机器学习研究者,绝大部分是把机器学习当作应用统计学。他们关注的是如何把统计学中的理论和方法变成可以在计算机上有效实现的算法,至于这样的算法对人工智能中的什么问题有用,他们并不care

引两位著名学者的话结尾,一位是人工智能大奖得主、一位是统计学习大家,名字我不说了,省得惹麻烦:

I do not come to AI to do statistics”

 

I do not have interest in AI”

 

       第一句话“I do not come to AI to do statistics”似乎是Ng Andrew说的,他的lectures中可以看到他把20个课时中的4个课时用来讲reinforcement learning,这我感觉是非常罕见的,从这一点上也许可以看出他对机器学习的理解。

      

       也许statistical machine learning or symbolic machine learning

  评论这张
 
阅读(2035)| 评论(0)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017