注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

Koala++'s blog

计算广告学 RTB

 
 
 

日志

 
 

Lucene源码分析-说明  

2009-07-02 16:10:53|  分类: Lucene |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

         先说一下,我的分析的翻译中引用了:

Lucene2.0+Heritrix[邱哲,符滔滔]

守护地下铁,http://hi.baidu.com/shirdrn

中的部分内容。

 

         再说一下我这次源码分析的特点,特别的乱,你可能看完全不知道我讲到哪里了,我并没有像别人一样一个类一个类的介绍,而是程序执行到哪,我就讲到哪。

         需要强调的是,如果你以前看过一点lucene的代码,看我的介绍会发现有的内容犯了很严重的错误,不要大骂一通,就不看了,其实我有可能在后面会讲正确的(如果发现我后面没讲,那还是大骂一通比较好,让我知道我错了)

         最后,我不会讲太基础的内容,比如如何建索引之类的,这些网上,书上都有,我不想拷贝别人的,也不想自己写,但是如果你不看,你可能会非常糊涂,或者根本看不懂。我之所以这么说,是因为我原来就是下载了一份lucene代码,在完全不懂的情况下开始分析,非常痛苦(比这更疯狂的是,我以前抓起linux代码就开始分析)。还需要强调一点的是,我的java没有认真学过,术语和概念不正确的也是很正常的,但我一般还是会查一下,尽量不讲错。

         差点忘了讲我写的源代码分析的优点了,它的优点就是因为我不是高手,所以我讲的很细致,我会把几乎所有有点值得讲的地方都讲到,除非我自己也不懂。我希望我的这一个系列可以帮助一些想分析lucene源代码的人很快地了解它的原理和思想。

         当我们准备开始认真分析一个问题的时候,我们首先考虑的是这问题我们可不可以解决,当时我看Weka中的J48的时候,我感觉太复杂了,但是王义说他看懂了,我马上认为这代码认真看,应该是可以看懂的,当有这种想法之后,其实只花了不多的时候就差不多搞清楚了。又比如SVM,当时看它的理论是非常吓人的,也就没认真看,但是当我听实验室里的一个同学说,她差不多清楚的时候(后面发现她也没有太清楚),我马上把SVM的资料翻出来开始看,现在我对SVM也有一些理解了。概括地讲,就是我们总是希望一个我们要开始的工作,很多人都成功地完成过,并且还有一些完成的证据(比如Blog),我们就会信心十足地开始我们工作。

  评论这张
 
阅读(1833)| 评论(0)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017