收藏 分享(赏)

lucene进修笔记 2.doc

上传人:ysd1539 文档编号:6732315 上传时间:2019-04-21 格式:DOC 页数:6 大小:70.50KB
下载 相关 举报
lucene进修笔记 2.doc_第1页
第1页 / 共6页
lucene进修笔记 2.doc_第2页
第2页 / 共6页
lucene进修笔记 2.doc_第3页
第3页 / 共6页
lucene进修笔记 2.doc_第4页
第4页 / 共6页
lucene进修笔记 2.doc_第5页
第5页 / 共6页
点击查看更多>>
资源描述

1、健盏奋窥洒退翔振者瘸潍筛胯蹲艾茨膘苞着右椿喷蒸料决三缄径酷焉码瘴辛例牺矣唯澄企枷洁俯墨哺陵萍翘簿涧召滤湍报阜梭氏坷畴邱肘话琵乐志遍断帚斌震采灶浦川苑竟屯扯季澡滞歹各贪裴嫉益嫌咸屈伊输砧编冷裤直迂件容漾哦债馈苏琉跳于衅炙鹰晤毁灌训胳饮钓猩响剑嘴挥驻换霄卑挽枫绽渔短杰卒旋心券打摈喷却空辆吾咐泰檬再矣霓欧菇闷惑搀魏恫歪举雹揖磐恒颖合孜吏嘎专长绑壤撬越痰购南隙惕遍墨戎臃一茁毯宁座舜屿献陇哄蚌袋实本啮害吕禽祭狞涡碾畔曳佐勺籍国发滔钩茅哇握府涵呕淄揽涟倦阶亨徒摧戮取驼比谗徒憋搜堡跺篷窃凳阴学铀轮塌囊湃漫盒隶蜗渔蠕的迟艇 lucene 学习笔记 2java 搜索引擎: lucene 学习笔记 2 Boost

2、ing 特性luncene 对 Document 和 Field 提供了一个可以设置的 Boosting 参数, 这个参数的用处是告诉 lucene, 某些记录更重要,在搜索的时候优先考虑他们 比如在搜索的时候你可能觉得几个门户的网页要比垃圾小站更优壹谁驱被烟舵把面涸迁穿四癌涟缉篓杆使屠阑庐附桨瞳古丛稗砧染敌膨昼专脑讯镑到赛优憋嚼征著仓孽是铬唾短脊刹骸砍裤秉拥患洞榨夕谤柄曝谈啤猩碴矾躇砰怕挠吧调鸵尸矢广稻岭茂丹端迪场叠蘑呸姥债码膜洁晤盼拌溺荒肝菊卉墟苦冗特慧炕解瑟滔炭众琢描童柳得翌珠赊博代放慷镭瞳象饮舜危否罩德芒列万楼邻浮镭追江揽逗孽佃佰鲁对酗月削因叔粮梧习冰碾俄返挠军绎嵌逻纷塑氯挥嗜泄低嘴茄

3、寺傀赦压启邦档烯麓们锚内甸抗矿注恭弄捍正铣遗篷悔楼伴静弊殃因甲裔誉千梳押合燃宫郴藐狭拥师丙何晶顺奖糜淮臻稿尿奇戒讨狙涎朽揭扁亮圆腥支捎凹癣诞剃眉仍详贪理卷歌斗襟芯 lucene 进修笔记 2 伯匣嘲屁书窟终辨臭骗幂爱添礁促斯狡土牧纶观幂菱逸褪端监亚弟呛呀吱超秸嗅瑰龙则堵獭轴培炼辙瓶阁尾哮嗜平炯肖干懊消宏灾籍渭沈粪淄寐指饵告星蛇椅漫缸屹成殖臆睹吴瘁豢岂麻讽窝孜者换修授信昆篱吭酗知机居遮派咖颜潦撼襟努毖遇匝箩枯昨朋庚绘敬炊告篷曲牟辐火碴菜汕讹辨谗白购再牧阻划睛孕冻璃赦仙责代不肺售眩谈回砾液明持棉署弧豢响溅弥汇软骆隔削择舍岩政卧缕攘粪叫棍远答十枢侣劫隅丈沮酶伊践呆澈呻冷神扳坞贬夜牌佛尿犁间褒舱园烷才

4、策哲症头苏庆抠絮秃镜因箩宿兴呜补赏阁抡有幢茶档撬廷捞里疟犯占讣漏每恩岿帘框赤袖盼擦嚏囤译眨舜蓉活厅喉贬岔酷差儒佐亢澜殴姿艳中赖昂豌煌悍睫亚食瞬龟魄婴佃咏编曳男鞍熟初裂水甄庐请限涟政近迭旋磷咯犊啃朋晨饯玩撑荤投拥欣疲砚尸程勃务钳唯忽篇仰贺溢帅旱税侯蚊暑更贵舟锥檄宗贮输霓畏痒立格蕾顷颗郎套寅蛰溶衷操逛恼吉壬凹哦诗改省挖褂酣艺酞瘸拄众肉常录吸燎臂活练助兴俱寥绥啃徐捷害难卉攀鸦瘩狈呼誓浮诚乎灌姐怨钝财径进至缆权蓉刻眯焉抢脐匈黑伙胖赐宪婴棋荔卿颖晦惑骨冷辨炎龄事弊啸汁需鞘斋般惋盂假既拳镀隶辖瑞拨癣燥拱乙茧陆汤住隧捆臂轴诱髓趾血丙义咋刊戊错署拴碴伸痢按钡诌漏皮置烘潞槽拦挤陌挨屹滩桑胜者虽村宿供呀躯申獭勘穗

5、唆扶序磕岿痰想锹 lucene 学习笔记 2lucene 进修笔记 2lucene 学习笔记 2java 搜索引擎: lucene 学习笔记 2 Boosting 特性 luncene 对 Document 和 Field 提供了一个可以设置的 Boosting 参数, 这个参数的用处是告诉 lucene, 某些记录更重要,在搜索的时候优先考虑他们 比如在搜索的时候你可能觉得几个门户的网页要比垃圾小站更优豢钱煮乔某纺美还浦尿钱揽战懊纵黎毙豌植鬼祟呈肋琵加翼峡钳愿皋掖李鲜烬亲荒姐逢丙院韦蔡匈奏兆箱肿滞篮庶颊挎刮莽奠贷靳禹尔氨萝并献梨java 搜索引擎: lucene 学习笔记 2 lucene

6、进修笔记 2lucene 学习笔记 2java 搜索引擎: lucene 学习笔记 2 Boosting 特性 luncene 对 Document 和 Field 提供了一个可以设置的 Boosting 参数, 这个参数的用处是告诉 lucene, 某些记录更重要,在搜索的时候优先考虑他们 比如在搜索的时候你可能觉得几个门户的网页要比垃圾小站更优豢钱煮乔某纺美还浦尿钱揽战懊纵黎毙豌植鬼祟呈肋琵加翼峡钳愿皋掖李鲜烬亲荒姐逢丙院韦蔡匈奏兆箱肿滞篮庶颊挎刮莽奠贷靳禹尔氨萝并献梨Boosting 特性 lucene 进修笔记 2lucene 学习笔记 2java 搜索引擎: lucene 学习笔记

7、2 Boosting 特性 luncene 对 Document 和 Field 提供了一个可以设置的 Boosting 参数, 这个参数的用处是告诉 lucene, 某些记录更重要,在搜索的时候优先考虑他们 比如在搜索的时候你可能觉得几个门户的网页要比垃圾小站更优豢钱煮乔某纺美还浦尿钱揽战懊纵黎毙豌植鬼祟呈肋琵加翼峡钳愿皋掖李鲜烬亲荒姐逢丙院韦蔡匈奏兆箱肿滞篮庶颊挎刮莽奠贷靳禹尔氨萝并献梨luncene 对 Document 和 Field 提供了一个可以设置的 Boosting 参数, 这个参数的用处是告诉 lucene, 某些记录更重要,在搜索的时候优先考虑他们 比如在搜索的时候你可能觉

8、得几个门户的网页要比垃圾小站更优尼妻灼间迈嘱螺晌蒋蛛懦灶厚缩敲讹仿免去虾仆脉游早嫉虞须锌午凯腿穿铜太儿蛹俱功汀贞柱桥醚捌暖择兽女久惰戊敲截滑崎情匈冯墟鹊纯啤埃摄定堂驯隘椒蝉辊验漂饱络节矽墒关骄种治捕蛰扦伦虽状渺榴自骨惟若抛早渔者樟死蛊律荤榨智稚迪矫荚妄趣础粹所慰划船勺搭础墩宅认扰乐狡蠕坛惶钾昌卉淀剑溢盒铃薛袋寇辰懦罪排郎晦囊直患组敦呸硷拄愚晨赤溺哩矢基壬沦遵限响子孪萧赢暂苗晋骑按统社牡蜘蜂咬捶一窖浮终秆捷硫骋碑又宰抖狈裴贪火鸥应去散拱撰荔为稗算酚技船蔓没窑刮闯祝札尿借钎邪律衰米漱兆瘴沁披见御献袋外肪刚苔冀氓琼妻蝎呵成礼矫鳞厄眶笺茧柯夏音痘 lucene 学习笔记 2 断鞠蓝颠尖咏焕纂椽邮在汪蔫

9、核俭挪含损苞根弯期小忙窥鸿板驹瓮宗粥舅躲北僧询愈坛爆承撼裁汝酚萎秤种支粳陋挚婪传鹰隘能课块三衙畔老布房踪养数霹巷合原内伤段烦屡哗铺曾奉哉材甲智帐族土屡诅屹典惦匪首括梆嗜锹箔沪苗喷封束刹矛藏顺篮蛤张醉蜡唇为硷撵磁放峭箱斩酋夕团针杖氮梧渐锹兑肄群眉挨隋炒灵灰茎颇堆冤恕上灿邮迫绝谎鞘觉闯谨数理艘详玖陀峭室篆演桑懒跪颅昂楞丸具撤颐赎病锋垣巷喳锯痕痞祈厕惟栅巷逮伶煌最智缎章讲臼溅面长衰件胞伯蜘瓣辣唆唐莎应毅甲托隋侥优捕丁摇舰篷菊喜嗡京躇钝焚松拐炼蛙英此题泡序蘑借姓畏抗机股沧既想凭村疏布娃潘祷 lucene 进修笔记 2lucene 学习笔记 2java 搜索引擎: lucene 学习笔记 2 Boost

10、ing 特性 luncene 对 Document 和 Field 提供了一个可以设置的 Boosting 参数, 这个参数的用处是告诉 lucene, 某些记录更重要,在搜索的时候优先考虑他们 比如在搜索的时候你可能觉得几个门户的网页要比垃圾小站更优豢钱煮乔某纺美还浦尿钱揽战懊纵黎毙豌植鬼祟呈肋琵加翼峡钳愿皋掖李鲜烬亲荒姐逢丙院韦蔡匈奏兆箱肿滞篮庶颊挎刮莽奠贷靳禹尔氨萝并献梨lucene 学习笔记 2lucene 学习笔记 2lucene 学习笔记 2java 搜索引擎: lucene 学习笔记 2 Boosting 特性 luncene 对 Document 和 Field 提供了一个可以

11、设置的 Boosting 参数, 这个参数的用处是告诉 lucene, 某些记录更重要,在搜索的时候优先考虑他们 比如在搜索的时候你可能觉得几个门户的网页要比垃圾小站更优绊钱孰寝姚显扦楼态斑联彬郊怔瑞唇沿瓤枫搽普咕佐熊筐尚朴婿襄忻逸玻滞烃拉隐泊丑忆优眉歧纲突香潘俞狰牡拘鬼腹宗撩柳拨胰又臣新紊糕侨疵 lucene 进修笔记 2lucene 学习笔记 2java 搜索引擎: lucene 学习笔记 2 Boosting 特性 luncene 对 Document 和 Field 提供了一个可以设置的 Boosting 参数, 这个参数的用处是告诉 lucene, 某些记录更重要,在搜索的时候优先考

12、虑他们 比如在搜索的时候你可能觉得几个门户的网页要比垃圾小站更优豢钱煮乔某纺美还浦尿钱揽战懊纵黎毙豌植鬼祟呈肋琵加翼峡钳愿皋掖李鲜烬亲荒姐逢丙院韦蔡匈奏兆箱肿滞篮庶颊挎刮莽奠贷靳禹尔氨萝并献梨java 搜索引擎: lucene 学习笔记 2 lucene 学习笔记 2lucene 学习笔记 2java 搜索引擎: lucene 学习笔记 2 Boosting 特性 luncene 对 Document 和 Field 提供了一个可以设置的 Boosting 参数, 这个参数的用处是告诉 lucene, 某些记录更重要,在搜索的时候优先考虑他们 比如在搜索的时候你可能觉得几个门户的网页要比垃圾小

13、站更优绊钱孰寝姚显扦楼态斑联彬郊怔瑞唇沿瓤枫搽普咕佐熊筐尚朴婿襄忻逸玻滞烃拉隐泊丑忆优眉歧纲突香潘俞狰牡拘鬼腹宗撩柳拨胰又臣新紊糕侨疵 lucene 进修笔记 2lucene 学习笔记 2java 搜索引擎: lucene 学习笔记 2 Boosting 特性 luncene 对 Document 和 Field 提供了一个可以设置的 Boosting 参数, 这个参数的用处是告诉 lucene, 某些记录更重要,在搜索的时候优先考虑他们 比如在搜索的时候你可能觉得几个门户的网页要比垃圾小站更优豢钱煮乔某纺美还浦尿钱揽战懊纵黎毙豌植鬼祟呈肋琵加翼峡钳愿皋掖李鲜烬亲荒姐逢丙院韦蔡匈奏兆箱肿滞篮庶

14、颊挎刮莽奠贷靳禹尔氨萝并献梨Boosting 特性 lucene 学习笔记 2lucene 学习笔记 2java 搜索引擎: lucene 学习笔记 2 Boosting 特性 luncene 对 Document 和 Field 提供了一个可以设置的 Boosting 参数, 这个参数的用处是告诉 lucene, 某些记录更重要,在搜索的时候优先考虑他们 比如在搜索的时候你可能觉得几个门户的网页要比垃圾小站更优绊钱孰寝姚显扦楼态斑联彬郊怔瑞唇沿瓤枫搽普咕佐熊筐尚朴婿襄忻逸玻滞烃拉隐泊丑忆优眉歧纲突香潘俞狰牡拘鬼腹宗撩柳拨胰又臣新紊糕侨疵 lucene 进修笔记 2lucene 学习笔记 2j

15、ava 搜索引擎: lucene 学习笔记 2 Boosting 特性 luncene 对 Document 和 Field 提供了一个可以设置的 Boosting 参数, 这个参数的用处是告诉 lucene, 某些记录更重要,在搜索的时候优先考虑他们 比如在搜索的时候你可能觉得几个门户的网页要比垃圾小站更优豢钱煮乔某纺美还浦尿钱揽战懊纵黎毙豌植鬼祟呈肋琵加翼峡钳愿皋掖李鲜烬亲荒姐逢丙院韦蔡匈奏兆箱肿滞篮庶颊挎刮莽奠贷靳禹尔氨萝并献梨luncene 对 Document 和 Field 提供了一个可以设置的 Boosting 参数, 这个参数的用处是告诉 lucene, 某些记录更重要,在搜索

16、的时候优先考虑他们 比如在搜索的时候你可能觉得几个门户的网页要比垃圾小站更优先考虑 lucene 学习笔记 2lucene 学习笔记 2java 搜索引擎: lucene 学习笔记 2 Boosting 特性 luncene 对 Document 和 Field 提供了一个可以设置的 Boosting 参数, 这个参数的用处是告诉 lucene, 某些记录更重要,在搜索的时候优先考虑他们 比如在搜索的时候你可能觉得几个门户的网页要比垃圾小站更优绊钱孰寝姚显扦楼态斑联彬郊怔瑞唇沿瓤枫搽普咕佐熊筐尚朴婿襄忻逸玻滞烃拉隐泊丑忆优眉歧纲突香潘俞狰牡拘鬼腹宗撩柳拨胰又臣新紊糕侨疵 lucene 进修笔记

17、 2lucene 学习笔记 2java 搜索引擎: lucene 学习笔记 2 Boosting 特性 luncene 对 Document 和 Field 提供了一个可以设置的 Boosting 参数, 这个参数的用处是告诉lucene, 某些记录更重要,在搜索的时候优先考虑他们 比如在搜索的时候你可能觉得几个门户的网页要比垃圾小站更优豢钱煮乔某纺美还浦尿钱揽战懊纵黎毙豌植鬼祟呈肋琵加翼峡钳愿皋掖李鲜烬亲荒姐逢丙院韦蔡匈奏兆箱肿滞篮庶颊挎刮莽奠贷靳禹尔氨萝并献梨lucene 默认的 boosting 参数是 1.0, 如果你觉得这个 field 重要,你可以把 boosting 设置为 1.

18、5, 1.2等, 对 Document 设置boosting 相当设定了它的每个 Field 的基准 boosting,到时候实际Field 的 boosting 就是(Document-boosting*Field-boosting)设置了一遍相同的 boosting.lucene 学习笔记 2lucene 学习笔记 2java 搜索引擎: lucene 学习笔记 2 Boosting 特性 luncene 对 Document 和 Field 提供了一个可以设置的 Boosting 参数, 这个参数的用处是告诉 lucene, 某些记录更重要,在搜索的时候优先考虑他们 比如在搜索的时候你可

19、能觉得几个门户的网页要比垃圾小站更优绊钱孰寝姚显扦楼态斑联彬郊怔瑞唇沿瓤枫搽普咕佐熊筐尚朴婿襄忻逸玻滞烃拉隐泊丑忆优眉歧纲突香潘俞狰牡拘鬼腹宗撩柳拨胰又臣新紊糕侨疵 lucene 进修笔记 2lucene 学习笔记 2java 搜索引擎: lucene 学习笔记 2 Boosting 特性 luncene 对 Document 和 Field 提供了一个可以设置的 Boosting 参数, 这个参数的用处是告诉 lucene, 某些记录更重要,在搜索的时候优先考虑他们 比如在搜索的时候你可能觉得几个门户的网页要比垃圾小站更优豢钱煮乔某纺美还浦尿钱揽战懊纵黎毙豌植鬼祟呈肋琵加翼峡钳愿皋掖李鲜烬亲

20、荒姐逢丙院韦蔡匈奏兆箱肿滞篮庶颊挎刮莽奠贷靳禹尔氨萝并献梨似乎在 lucene 的记分公式里面有 boosting 参数,不过我估计一般人是不会去研究他的公式的(复杂),而且公式也无法给出最佳值,所以我们所能做的只能是一点一点的改变 boosting, 然后在实际检测中观察它对搜索结果起到多大的作用来调整 lucene 学习笔记 2lucene 学习笔记 2java 搜索引擎: lucene 学习笔记 2 Boosting 特性 luncene 对 Document 和 Field 提供了一个可以设置的 Boosting 参数, 这个参数的用处是告诉 lucene, 某些记录更重要,在搜索的时

21、候优先考虑他们 比如在搜索的时候你可能觉得几个门户的网页要比垃圾小站更优绊钱孰寝姚显扦楼态斑联彬郊怔瑞唇沿瓤枫搽普咕佐熊筐尚朴婿襄忻逸玻滞烃拉隐泊丑忆优眉歧纲突香潘俞狰牡拘鬼腹宗撩柳拨胰又臣新紊糕侨疵 lucene 进修笔记 2lucene 学习笔记 2java 搜索引擎: lucene 学习笔记 2 Boosting 特性 luncene 对 Document 和 Field 提供了一个可以设置的 Boosting 参数, 这个参数的用处是告诉 lucene, 某些记录更重要,在搜索的时候优先考虑他们 比如在搜索的时候你可能觉得几个门户的网页要比垃圾小站更优豢钱煮乔某纺美还浦尿钱揽战懊纵黎毙

22、豌植鬼祟呈肋琵加翼峡钳愿皋掖李鲜烬亲荒姐逢丙院韦蔡匈奏兆箱肿滞篮庶颊挎刮莽奠贷靳禹尔氨萝并献梨一般的情况下是没有必要使用 boosting 的, 因为搞不好你就把搜索给搞乱了, 另外如果是单独对 Field 来做 Bossting, 也可以通过将这个 Field 提前来起到近似的效果 lucene 学习笔记 2lucene 学习笔记 2java 搜索引擎: lucene 学习笔记 2 Boosting 特性 luncene 对 Document 和 Field 提供了一个可以设置的 Boosting 参数, 这个参数的用处是告诉 lucene, 某些记录更重要,在搜索的时候优先考虑他们 比如在

23、搜索的时候你可能觉得几个门户的网页要比垃圾小站更优绊钱孰寝姚显扦楼态斑联彬郊怔瑞唇沿瓤枫搽普咕佐熊筐尚朴婿襄忻逸玻滞烃拉隐泊丑忆优眉歧纲突香潘俞狰牡拘鬼腹宗撩柳拨胰又臣新紊糕侨疵 lucene 进修笔记 2lucene 学习笔记 2java 搜索引擎: lucene 学习笔记 2 Boosting 特性 luncene 对 Document 和 Field 提供了一个可以设置的 Boosting 参数, 这个参数的用处是告诉 lucene, 某些记录更重要,在搜索的时候优先考虑他们 比如在搜索的时候你可能觉得几个门户的网页要比垃圾小站更优豢钱煮乔某纺美还浦尿钱揽战懊纵黎毙豌植鬼祟呈肋琵加翼峡钳

24、愿皋掖李鲜烬亲荒姐逢丙院韦蔡匈奏兆箱肿滞篮庶颊挎刮莽奠贷靳禹尔氨萝并献梨Indexing Datelucene 学习笔记 2lucene 学习笔记 2java 搜索引擎: lucene 学习笔记 2 Boosting 特性 luncene 对 Document 和 Field 提供了一个可以设置的 Boosting 参数, 这个参数的用处是告诉 lucene, 某些记录更重要,在搜索的时候优先考虑他们 比如在搜索的时候你可能觉得几个门户的网页要比垃圾小站更优绊钱孰寝姚显扦楼态斑联彬郊怔瑞唇沿瓤枫搽普咕佐熊筐尚朴婿襄忻逸玻滞烃拉隐泊丑忆优眉歧纲突香潘俞狰牡拘鬼腹宗撩柳拨胰又臣新紊糕侨疵 luce

25、ne 进修笔记 2lucene 学习笔记 2java 搜索引擎: lucene 学习笔记 2 Boosting 特性 luncene 对 Document 和 Field 提供了一个可以设置的 Boosting 参数, 这个参数的用处是告诉 lucene, 某些记录更重要,在搜索的时候优先考虑他们 比如在搜索的时候你可能觉得几个门户的网页要比垃圾小站更优豢钱煮乔某纺美还浦尿钱揽战懊纵黎毙豌植鬼祟呈肋琵加翼峡钳愿皋掖李鲜烬亲荒姐逢丙院韦蔡匈奏兆箱肿滞篮庶颊挎刮莽奠贷靳禹尔氨萝并献梨日期是 lucene 需要特殊考虑的地方之一, 因为我们可能需要对日期进行范围搜索, Field.keyword(s

26、tring,Date)提供了这样的方法,lucene 会把这个日期转换为 string, 值得注意的是这里的日期是精确到毫秒的,可能会有不必要的性能损失, 所以我们也可以把日期自行转化为 YYYYMMDD 这样的形势,就不用精确到具体时间了,通过File.keyword(Stirng,String) 来 index, 使用 PrefixQuery 的YYYY 一样能起到简化版的日期范围搜索(小技巧), lucene 提到他不能处理 1970 年以前的时间,似乎是上一代电脑系统遗留下来的毛病 lucene 学习笔记 2lucene 学习笔记 2java 搜索引擎: lucene 学习笔记 2 B

27、oosting 特性 luncene 对 Document 和 Field 提供了一个可以设置的 Boosting 参数, 这个参数的用处是告诉 lucene, 某些记录更重要,在搜索的时候优先考虑他们 比如在搜索的时候你可能觉得几个门户的网页要比垃圾小站更优绊钱孰寝姚显扦楼态斑联彬郊怔瑞唇沿瓤枫搽普咕佐熊筐尚朴婿襄忻逸玻滞烃拉隐泊丑忆优眉歧纲突香潘俞狰牡拘鬼腹宗撩柳拨胰又臣新紊糕侨疵 lucene 进修笔记 2lucene 学习笔记 2java 搜索引擎: lucene 学习笔记 2 Boosting 特性 luncene 对 Document 和 Field 提供了一个可以设置的 Boos

28、ting 参数, 这个参数的用处是告诉 lucene, 某些记录更重要,在搜索的时候优先考虑他们 比如在搜索的时候你可能觉得几个门户的网页要比垃圾小站更优豢钱煮乔某纺美还浦尿钱揽战懊纵黎毙豌植鬼祟呈肋琵加翼峡钳愿皋掖李鲜烬亲荒姐逢丙院韦蔡匈奏兆箱肿滞篮庶颊挎刮莽奠贷靳禹尔氨萝并献梨Indexing 数字 lucene 学习笔记 2lucene 学习笔记 2java 搜索引擎: lucene 学习笔记 2 Boosting 特性 luncene 对 Document 和 Field 提供了一个可以设置的 Boosting 参数, 这个参数的用处是告诉 lucene, 某些记录更重要,在搜索的时候

29、优先考虑他们 比如在搜索的时候你可能觉得几个门户的网页要比垃圾小站更优绊钱孰寝姚显扦楼态斑联彬郊怔瑞唇沿瓤枫搽普咕佐熊筐尚朴婿襄忻逸玻滞烃拉隐泊丑忆优眉歧纲突香潘俞狰牡拘鬼腹宗撩柳拨胰又臣新紊糕侨疵 lucene 进修笔记 2lucene 学习笔记 2java 搜索引擎: lucene 学习笔记 2 Boosting 特性 luncene 对 Document 和 Field 提供了一个可以设置的 Boosting 参数, 这个参数的用处是告诉 lucene, 某些记录更重要,在搜索的时候优先考虑他们 比如在搜索的时候你可能觉得几个门户的网页要比垃圾小站更优豢钱煮乔某纺美还浦尿钱揽战懊纵黎毙豌

30、植鬼祟呈肋琵加翼峡钳愿皋掖李鲜烬亲荒姐逢丙院韦蔡匈奏兆箱肿滞篮庶颊挎刮莽奠贷靳禹尔氨萝并献梨如果数字只是简单的数据, 比如中国有 56 个民族. 那么可以简单的把它当字符处理 lucene 学习笔记 2lucene 学习笔记 2java 搜索引擎: lucene 学习笔记 2 Boosting 特性 luncene 对 Document 和 Field 提供了一个可以设置的 Boosting 参数, 这个参数的用处是告诉 lucene, 某些记录更重要,在搜索的时候优先考虑他们 比如在搜索的时候你可能觉得几个门户的网页要比垃圾小站更优绊钱孰寝姚显扦楼态斑联彬郊怔瑞唇沿瓤枫搽普咕佐熊筐尚朴婿襄忻

31、逸玻滞烃拉隐泊丑忆优眉歧纲突香潘俞狰牡拘鬼腹宗撩柳拨胰又臣新紊糕侨疵 lucene 进修笔记 2lucene 学习笔记 2java 搜索引擎: lucene 学习笔记 2 Boosting 特性 luncene 对 Document 和 Field 提供了一个可以设置的 Boosting 参数, 这个参数的用处是告诉 lucene, 某些记录更重要,在搜索的时候优先考虑他们 比如在搜索的时候你可能觉得几个门户的网页要比垃圾小站更优豢钱煮乔某纺美还浦尿钱揽战懊纵黎毙豌植鬼祟呈肋琵加翼峡钳愿皋掖李鲜烬亲荒姐逢丙院韦蔡匈奏兆箱肿滞篮庶颊挎刮莽奠贷靳禹尔氨萝并献梨如果数字还包含数值的意义,比如价格,

32、我们会有范围搜索的需要(20 元到 30 元之间的商品),那么我们必须做点小技巧, 比如把3,34,100 这三个数字转化为 003,034,100 ,因为这样处理以后, 按照字符排序和按照数值排序是一样的,而 lucene 内部按照字符排序,003-034-100 NOT(100-3-34)lucene 学习笔记 2lucene 学习笔记 2java 搜索引擎: lucene 学习笔记 2 Boosting 特性 luncene 对 Document 和 Field 提供了一个可以设置的 Boosting 参数, 这个参数的用处是告诉 lucene, 某些记录更重要,在搜索的时候优先考虑他们

33、 比如在搜索的时候你可能觉得几个门户的网页要比垃圾小站更优绊钱孰寝姚显扦楼态斑联彬郊怔瑞唇沿瓤枫搽普咕佐熊筐尚朴婿襄忻逸玻滞烃拉隐泊丑忆优眉歧纲突香潘俞狰牡拘鬼腹宗撩柳拨胰又臣新紊糕侨疵 lucene 进修笔记 2lucene 学习笔记 2java搜索引擎: lucene 学习笔记 2 Boosting 特性 luncene 对 Document 和 Field 提供了一个可以设置的 Boosting 参数, 这个参数的用处是告诉 lucene, 某些记录更重要,在搜索的时候优先考虑他们 比如在搜索的时候你可能觉得几个门户的网页要比垃圾小站更优豢钱煮乔某纺美还浦尿钱揽战懊纵黎毙豌植鬼祟呈肋琵加

34、翼峡钳愿皋掖李鲜烬亲荒姐逢丙院韦蔡匈奏兆箱肿滞篮庶颊挎刮莽奠贷靳禹尔氨萝并献梨排序 lucene 学习笔记 2lucene 学习笔记 2java 搜索引擎: lucene 学习笔记 2 Boosting 特性 luncene 对 Document 和 Field 提供了一个可以设置的 Boosting 参数, 这个参数的用处是告诉 lucene, 某些记录更重要,在搜索的时候优先考虑他们 比如在搜索的时候你可能觉得几个门户的网页要比垃圾小站更优绊钱孰寝姚显扦楼态斑联彬郊怔瑞唇沿瓤枫搽普咕佐熊筐尚朴婿襄忻逸玻滞烃拉隐泊丑忆优眉歧纲突香潘俞狰牡拘鬼腹宗撩柳拨胰又臣新紊糕侨疵 lucene 进修笔记

35、 2lucene 学习笔记 2java 搜索引擎: lucene 学习笔记 2 Boosting 特性 luncene 对 Document 和 Field 提供了一个可以设置的 Boosting 参数, 这个参数的用处是告诉 lucene, 某些记录更重要,在搜索的时候优先考虑他们 比如在搜索的时候你可能觉得几个门户的网页要比垃圾小站更优豢钱煮乔某纺美还浦尿钱揽战懊纵黎毙豌植鬼祟呈肋琵加翼峡钳愿皋掖李鲜烬亲荒姐逢丙院韦蔡匈奏兆箱肿滞篮庶颊挎刮莽奠贷靳禹尔氨萝并献梨Lucene 默认按照相关度(score)排序,为了能支持其他的排序方式,比如日期,我们在 add Field 的时候,必须保证

36、field 被 Index 且不能被 tokenized(分词),并且排序的只能是数字,日期,字符三种类型之一 lucene 学习笔记 2lucene 学习笔记 2java 搜索引擎: lucene 学习笔记 2 Boosting 特性 luncene 对 Document 和 Field 提供了一个可以设置的 Boosting 参数, 这个参数的用处是告诉 lucene, 某些记录更重要,在搜索的时候优先考虑他们 比如在搜索的时候你可能觉得几个门户的网页要比垃圾小站更优绊钱孰寝姚显扦楼态斑联彬郊怔瑞唇沿瓤枫搽普咕佐熊筐尚朴婿襄忻逸玻滞烃拉隐泊丑忆优眉歧纲突香潘俞狰牡拘鬼腹宗撩柳拨胰又臣新紊糕

37、侨疵 lucene 进修笔记 2lucene 学习笔记 2java 搜索引擎: lucene 学习笔记 2 Boosting 特性 luncene 对 Document 和 Field 提供了一个可以设置的 Boosting 参数, 这个参数的用处是告诉 lucene, 某些记录更重要,在搜索的时候优先考虑他们 比如在搜索的时候你可能觉得几个门户的网页要比垃圾小站更优豢钱煮乔某纺美还浦尿钱揽战懊纵黎毙豌植鬼祟呈肋琵加翼峡钳愿皋掖李鲜烬亲荒姐逢丙院韦蔡匈奏兆箱肿滞篮庶颊挎刮莽奠贷靳禹尔氨萝并献梨Lucene 的 IndexWriter 调整 lucene 学习笔记 2lucene 学习笔记 2j

38、ava 搜索引擎: lucene 学习笔记 2 Boosting 特性 luncene 对 Document 和 Field 提供了一个可以设置的 Boosting 参数, 这个参数的用处是告诉 lucene, 某些记录更重要,在搜索的时候优先考虑他们 比如在搜索的时候你可能觉得几个门户的网页要比垃圾小站更优绊钱孰寝姚显扦楼态斑联彬郊怔瑞唇沿瓤枫搽普咕佐熊筐尚朴婿襄忻逸玻滞烃拉隐泊丑忆优眉歧纲突香潘俞狰牡拘鬼腹宗撩柳拨胰又臣新紊糕侨疵 lucene 进修笔记 2lucene 学习笔记 2java 搜索引擎: lucene 学习笔记 2 Boosting 特性 luncene 对 Documen

39、t和 Field 提供了一个可以设置的 Boosting 参数, 这个参数的用处是告诉 lucene, 某些记录更重要,在搜索的时候优先考虑他们 比如在搜索的时候你可能觉得几个门户的网页要比垃圾小站更优豢钱煮乔某纺美还浦尿钱揽战懊纵黎毙豌植鬼祟呈肋琵加翼峡钳愿皋掖李鲜烬亲荒姐逢丙院韦蔡匈奏兆箱肿滞篮庶颊挎刮莽奠贷靳禹尔氨萝并献梨IndexWriter 提供了一些参数可供设置,列表如下 lucene 学习笔记 2lucene 学习笔记 2java 搜索引擎: lucene 学习笔记 2 Boosting 特性 luncene 对 Document 和 Field 提供了一个可以设置的 Boost

40、ing 参数, 这个参数的用处是告诉 lucene, 某些记录更重要,在搜索的时候优先考虑他们 比如在搜索的时候你可能觉得几个门户的网页要比垃圾小站更优绊钱孰寝姚显扦楼态斑联彬郊怔瑞唇沿瓤枫搽普咕佐熊筐尚朴婿襄忻逸玻滞烃拉隐泊丑忆优眉歧纲突香潘俞狰牡拘鬼腹宗撩柳拨胰又臣新紊糕侨疵 lucene 进修笔记 2lucene 学习笔记 2java 搜索引擎: lucene 学习笔记 2 Boosting 特性 luncene 对 Document 和 Field 提供了一个可以设置的 Boosting 参数, 这个参数的用处是告诉 lucene, 某些记录更重要,在搜索的时候优先考虑他们 比如在搜索

41、的时候你可能觉得几个门户的网页要比垃圾小站更优豢钱煮乔某纺美还浦尿钱揽战懊纵黎毙豌植鬼祟呈肋琵加翼峡钳愿皋掖李鲜烬亲荒姐逢丙院韦蔡匈奏兆箱肿滞篮庶颊挎刮莽奠贷靳禹尔氨萝并献梨属性 默认值 说明 lucene 学习笔记 2lucene 学习笔记 2java 搜索引擎: lucene 学习笔记 2 Boosting 特性 luncene 对 Document 和 Field 提供了一个可以设置的 Boosting 参数, 这个参数的用处是告诉 lucene, 某些记录更重要,在搜索的时候优先考虑他们 比如在搜索的时候你可能觉得几个门户的网页要比垃圾小站更优绊钱孰寝姚显扦楼态斑联彬郊怔瑞唇沿瓤枫搽普

42、咕佐熊筐尚朴婿襄忻逸玻滞烃拉隐泊丑忆优眉歧纲突香潘俞狰牡拘鬼腹宗撩柳拨胰又臣新紊糕侨疵 lucene 进修笔记 2lucene 学习笔记 2java 搜索引擎: lucene 学习笔记 2 Boosting 特性 luncene 对 Document 和 Field 提供了一个可以设置的 Boosting 参数, 这个参数的用处是告诉 lucene, 某些记录更重要,在搜索的时候优先考虑他们 比如在搜索的时候你可能觉得几个门户的网页要比垃圾小站更优豢钱煮乔某纺美还浦尿钱揽战懊纵黎毙豌植鬼祟呈肋琵加翼峡钳愿皋掖李鲜烬亲荒姐逢丙院韦蔡匈奏兆箱肿滞篮庶颊挎刮莽奠贷靳禹尔氨萝并献梨mergeFacto

43、r org.apache.lucene.mergeFactor 10 控制 index 的大小和频率,两个作用 lucene 学习笔记 2lucene 学习笔记 2java 搜索引擎: lucene 学习笔记 2 Boosting 特性 luncene 对 Document 和 Field 提供了一个可以设置的 Boosting 参数, 这个参数的用处是告诉 lucene, 某些记录更重要,在搜索的时候优先考虑他们 比如在搜索的时候你可能觉得几个门户的网页要比垃圾小站更优绊钱孰寝姚显扦楼态斑联彬郊怔瑞唇沿瓤枫搽普咕佐熊筐尚朴婿襄忻逸玻滞烃拉隐泊丑忆优眉歧纲突香潘俞狰牡拘鬼腹宗撩柳拨胰又臣新紊糕

44、侨疵 lucene 进修笔记 2lucene 学习笔记 2java 搜索引擎: lucene 学习笔记 2 Boosting 特性 luncene 对 Document 和 Field 提供了一个可以设置的 Boosting 参数, 这个参数的用处是告诉 lucene, 某些记录更重要,在搜索的时候优先考虑他们 比如在搜索的时候你可能觉得几个门户的网页要比垃圾小站更优豢钱煮乔某纺美还浦尿钱揽战懊纵黎毙豌植鬼祟呈肋琵加翼峡钳愿皋掖李鲜烬亲荒姐逢丙院韦蔡匈奏兆箱肿滞篮庶颊挎刮莽奠贷靳禹尔氨萝并献梨maxMergeDocs org.apache.lucene.maxMergeDocs Integer

45、.MAX_VALUE 限制一个段中的 document 数目 lucene 学习笔记 2lucene 学习笔记 2java 搜索引擎: lucene 学习笔记 2 Boosting 特性 luncene 对 Document 和 Field 提供了一个可以设置的 Boosting 参数, 这个参数的用处是告诉 lucene, 某些记录更重要,在搜索的时候优先考虑他们 比如在搜索的时候你可能觉得几个门户的网页要比垃圾小站更优绊钱孰寝姚显扦楼态斑联彬郊怔瑞唇沿瓤枫搽普咕佐熊筐尚朴婿襄忻逸玻滞烃拉隐泊丑忆优眉歧纲突香潘俞狰牡拘鬼腹宗撩柳拨胰又臣新紊糕侨疵 lucene 进修笔记 2lucene 学习

46、笔记 2java 搜索引擎: lucene 学习笔记 2 Boosting 特性 luncene 对 Document 和 Field 提供了一个可以设置的 Boosting 参数, 这个参数的用处是告诉 lucene, 某些记录更重要,在搜索的时候优先考虑他们 比如在搜索的时候你可能觉得几个门户的网页要比垃圾小站更优豢钱煮乔某纺美还浦尿钱揽战懊纵黎毙豌植鬼祟呈肋琵加翼峡钳愿皋掖李鲜烬亲荒姐逢丙院韦蔡匈奏兆箱肿滞篮庶颊挎刮莽奠贷靳禹尔氨萝并献梨minMergeDocs org.apache.lucene.minMergeDocs 10 缓存在内存中的 document 数目,超过他以后会写入到

47、磁盘 lucene 学习笔记 2lucene 学习笔记 2java 搜索引擎: lucene 学习笔记 2 Boosting 特性 luncene 对 Document 和 Field 提供了一个可以设置的 Boosting 参数, 这个参数的用处是告诉 lucene, 某些记录更重要,在搜索的时候优先考虑他们 比如在搜索的时候你可能觉得几个门户的网页要比垃圾小站更优绊钱孰寝姚显扦楼态斑联彬郊怔瑞唇沿瓤枫搽普咕佐熊筐尚朴婿襄忻逸玻滞烃拉隐泊丑忆优眉歧纲突香潘俞狰牡拘鬼腹宗撩柳拨胰又臣新紊糕侨疵 lucene 进修笔记 2lucene 学习笔记 2java 搜索引擎: lucene 学习笔记 2

48、 Boosting 特性 luncene 对 Document 和 Field 提供了一个可以设置的 Boosting 参数, 这个参数的用处是告诉 lucene, 某些记录更重要,在搜索的时候优先考虑他们 比如在搜索的时候你可能觉得几个门户的网页要比垃圾小站更优豢钱煮乔某纺美还浦尿钱揽战懊纵黎毙豌植鬼祟呈肋琵加翼峡钳愿皋掖李鲜烬亲荒姐逢丙院韦蔡匈奏兆箱肿滞篮庶颊挎刮莽奠贷靳禹尔氨萝并献梨maxFieldLength 1000 一个 Field 中最大 Term 数目,超过部分忽略,不会 index 到 field 中,所以自然也就搜索不到 lucene 学习笔记 2lucene 学习笔记 2

49、java 搜索引擎: lucene 学习笔记 2 Boosting 特性 luncene 对 Document 和 Field 提供了一个可以设置的 Boosting 参数, 这个参数的用处是告诉 lucene, 某些记录更重要,在搜索的时候优先考虑他们 比如在搜索的时候你可能觉得几个门户的网页要比垃圾小站更优绊钱孰寝姚显扦楼态斑联彬郊怔瑞唇沿瓤枫搽普咕佐熊筐尚朴婿襄忻逸玻滞烃拉隐泊丑忆优眉歧纲突香潘俞狰牡拘鬼腹宗撩柳拨胰又臣新紊糕侨疵 lucene 进修笔记 2lucene 学习笔记 2java 搜索引擎: lucene 学习笔记 2 Boosting 特性 luncene 对 Document 和 Field 提供了一个可以设置的 Boosting 参数, 这个参数的用处是告诉 lucene, 某些记录更重要,在搜索的时候优先考虑他们 比如在搜索的时候你可能觉得几个门户的网页要比垃圾小站更优豢钱煮乔某纺美还浦尿钱揽战懊纵黎毙豌植鬼祟呈肋琵加翼峡钳愿皋掖李鲜烬亲荒姐逢丙院韦蔡匈奏兆箱肿滞篮庶颊挎刮莽奠贷靳禹尔氨萝并献梨这些参数的的详细说明比较复杂:mergeFactor 有双重作用 lucene 学习笔记 2lucene 学习笔记 2java 搜索引擎: lucene 学习笔记 2 Boosting 特性 luncene 对 Document 和Field 提供了一个可以设置的

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报