广告引擎的索引设计实现和性能优化.ppt

上传人:创****公 文档编号:1869141 上传时间:2019-10-29 格式:PPT 页数:36 大小:777.50KB
返回 下载 相关 举报
广告引擎的索引设计实现和性能优化.ppt_第1页
第1页 / 共36页
广告引擎的索引设计实现和性能优化.ppt_第2页
第2页 / 共36页
点击查看更多>>
资源描述

《广告引擎的索引设计实现和性能优化.ppt》由会员分享,可在线阅读,更多相关《广告引擎的索引设计实现和性能优化.ppt(36页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、通用广告引擎的索引设计和性能优化,阿里妈妈事业部师陀,Agenda,背景索引设计和实现遇到的问题下一步工作性能优化过程性能优化小结Q&A,背景,广告引擎的基本状况层级结构:广告主-广告计划-广告商品-竞价词,背景,广告引擎的基本状况层级结构:广告主-广告计划-广告商品-竞价词广告查询流程Query解析- 倒排查询-过滤-算分-排序-拼装结果返回,背景,广告引擎的基本状况层级结构:广告主-广告计划-广告商品-竞价词在线查询流程Query解析- 倒排查询-过滤-算分-排序-拼装结果返回索引数据:每天重建全量 + 实时更新增量,背景,广告引擎的基本状况层级结构:广告主-广告计划-广告商品-竞价词在线

2、查询流程Query解析- 倒排查询-过滤-算分-排序-拼装结果返回索引数据:每天重建全量 + 实时更新增量多条产品线,引擎技术有通用性,背景,一年前:使用搜索引擎isearch的索引内核 + 自己开发的辅表结构相对实现复杂,正排读接口不清晰性能问题,背景,一年前:使用搜索引擎isearch的索引内核 + 自己开发的辅表结构相对实现复杂,正排读接口不清晰性能问题重构:新的通用广告引擎(一期)索引支持主辅表结构只做广告引擎需要的功能目标:性能和可维护性,索引设计,倒排:全量 + 增量Payload字段可配置增量的多级可回收内存池,索引设计,正排:主/辅表结构多种值类型:bit/int8/int16

3、/float/string多种字段类型:单值/固定多值/变长多值定长字段和变长字段的紧密存储Package表的关联字段平铺,索引设计,正排:主/辅表结构多种值类型:bit/int8/int16/float/string多种字段类型:单值/固定多值/变长多值Package表的关联字段平铺,索引设计,正排多种值类型:bit/int8/int16/float/string多种字段类型:单值/固定多值/变长多值定长字段和变长字段的紧密存储Package表的关联字段平铺主/辅表 + keyId-docId的hash表 + DeleteMap,索引实现,索引实现,索引实现,索引实现,索引实现,其他Tabl

4、eWriter的其他成员DeleteMapKeyIdHashTable相关小工具:indexLibPrinter,遇到的问题(1),Mmap的得失天然的弱持久化方案利用系统page cache管理数据局部性,遇到的问题(1),Mmap的得失天然的弱持久化方案利用系统page cache管理数据局部性脏页回写不可控,遇到的问题(1),Mmap的得失天然的弱持久化方案利用系统page cache管理数据局部性脏页回写不可控短期解决方案2.6.18内核:flush_mmap_pages=0,遇到的问题(1),Mmap的得失天然的弱持久化方案利用系统page cache管理数据局部性脏页回写不可控短期

5、解决方案2.6.18内核:flush_mmap_pages=0Page cache换入换出不可控,遇到的问题(1),Mmap的得失天然的弱持久化方案利用系统page cache管理数据局部性脏页回写不可控短期解决方案2.6.18内核:flush_mmap_pages=0Page cache换入换出不可控mlock:不符合极端情况的异常处理需求,遇到的问题(1),Mmap的得失天然的弱持久化方案利用系统page cache管理数据局部性脏页回写不可控短期解决方案2.6.18内核:flush_mmap_pages=0Page cache换入换出不可控mlock:不符合极端情况的异常处理需求另外的解

6、决方案:使用shm替换mmap,主动控制持久化和故障恢复,遇到的问题(2),稳定性每天build全量的过程牵涉的系统太多太复杂故障恢复的能力需要加强解决方案:索引重整 + 索引压缩,遇到的问题(2),稳定性每天build全量的过程牵涉的系统太多太复杂故障恢复的能力需要加强解决方案:索引重整能力 + 索引压缩数据灵活性跟分布式build的结合批量更新能力,下一步工作,广告引擎设计时的各项指标优先级稳定性正确性灵活性问题定位能力性能,下一步工作,一期的新引擎还是很像搜索引擎,dispatcher,searchNode,searchNode,searchNode,merger,下一步工作,dispa

7、tcher,searchNode,searchNode,searchNode,merger,分布式引擎索引数据中心,服务化的searchNode集群,期望的广告引擎,性能优化,目标:searchNode的单机qps优化,主要是cpu优化方法:Perf 热点分析代码优化业务层优化索引数据层优化Cpu资源利用最大化,性能优化过程,性能优化小结,工具帮助理解分析性能瓶颈,但不要仅对热点进行代码优化推荐Intel vtune的top-down视图,性能优化小结,工具帮助理解分析性能瓶颈,但不要仅对热点进行优化推荐Intel vtune的top-down视图针对内核/硬件特性的优化需谨慎,性能优化小结,工具帮助理解分析性能瓶颈,但不要仅对热点进行优化推荐Intel vtune的top-down视图针对内核/硬件特性的优化需谨慎关注数据局部性和整体代码质量(CPI),性能优化小结,工具帮助理解分析性能瓶颈,但不要仅对热点进行优化推荐Intel vtune的top-down视图针对内核/硬件特性的优化需谨慎关注数据局部性和整体代码质量(CPI)Cpu压不上去的几种原因:并发压力不够网卡跑满/某个线程or进程的cpu跑满锁竞争strace + pstack + taskset + 逐个调高并发数,性能优化的下一步,数据局部性:全量数据重排小库化:适应nehalem架构资源管理系统,谢谢,Q&A,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > pptx模板 > 工作办公

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com