注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

Koala++'s blog

计算广告学 RTB

 
 
 

日志

 
 

MLR(机器学习排序)  

2010-01-17 17:25:29|  分类: 搜索引擎 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

2010-1-17

前两天听口碑北京的同事讲MLR的两个算法,我当时没太听懂,按我当时的理解,ListNet算法与Logic Regression是一回事,就问了一下,结果回答我也没太听懂,又不好意思接着问,google了一下,把论文下载下来了《Learning to Rank: From Pairwise Approach to Listwise Approach》,我周五的睡觉前把论文读了一下,用周末把论文核心的部分译出来。还要抽时间校对一下才会公布。

         它的short version发表在ICML(顶级会议之一)上,应该还是不错的,这一段时间的翻译很让我痛苦,前一阵,同学想译Hadoop的一本书,我想帮着译一下,顺便也学一点,结果很多术语,我只知道大概的意思,具体中文是什么,完全不清楚,周末硬译了20页左右。周一上班时,同学告诉我,这本书已经有人译好了,我差点吐血。上一次做算法分享时的提到了一个text summation方面的,不过他似乎也不太清楚是这个,我google了一下,下载了一篇比较短的,我隐约记得是一篇好论文,回去已经翻译完了,译完发现,读实验部分的时候,发现他用的数据不是标准数据集,而且才50个样本,我很惊讶,再google的时候发现那论文档次很是一般,完全没有译的价值,甚至有没有看的价值都是问题。

         关于这次的翻译有几点要说明一下,1. 我对Ranking是不了解的,但我想我的翻译应该不会差太远,术语就算有不正确的地方,也是可以读懂的,数学的术语就不敢保证了。2. 作者们都是中国人,其中人一个人国籍写的TaiWan,这就不管了,因为这个原因,原文我感觉写的句子还是蛮中文的,我和其它学英语的都一样,只是能感觉出来,具体让我说哪不正宗,应该怎么写,我也不知道。3. Top One我没翻译,原因是翻译出来不好听,并且很多不懂英文的人都敢念top N,我相信这不会造成障碍。4. 对免费的东西,要有宽容的态度。最好不要一来就是,“从第一眼,我就知道作者的英文,中文,数学,计算机水平不行”,“我痛恨一切只教训我却不能丰富或直接加快我行动的事物”(歌德,尼采),有什么错,告诉我就可以了,我会虚心接受的。5. 版权的事,我从来也没搞清过,我想我这不是商业用途,并且这些作者应该没兴趣和我计较吧。

2010-1-18

         草草校对了一下,如果没人关心这一块,我想校对简直是浪费时间,昨天忘提了一件事,关于MLR可以看<Introduction to IR>15.4节,15章前面是讲SVM的,我本来就知道一些SVM,没认真看它写的,也关系不大,所以可以直接看15.4的内容,它本身写的也很好。我已经将文件上传到Weka中文站,weka开发版了,有兴趣的人可以看一下。

  评论这张
 
阅读(1962)| 评论(0)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017