190 likes | 494 Views
核高基项目封闭开发后续工作安排. 清华大学软件学院 信息系统与工程研究所. 提 纲. 封闭开发成果及遗留问题 后续研发工作 人员管理规定 项目管理规定. 提 纲. 封闭开发成果及遗留问题 后续研发工作 人员管理规定 项目管理规定. 成果及遗留问题. 成果 核心系统 明确了 LaUDMS 架构 底层存储:实现了 Cassandra 上的虚拟文件系统,封装了统一的存储访问接口 文本 检索 : 对 Katta 和 Zookeeper 进行了测试,发现并解决了部分 问题 特征提取:实现了图像特征及文件元数据的提取 高维索引:实现单机版的高维索引系统
E N D
核高基项目封闭开发后续工作安排 清华大学软件学院 信息系统与工程研究所
提 纲 • 封闭开发成果及遗留问题 • 后续研发工作 • 人员管理规定 • 项目管理规定
提 纲 • 封闭开发成果及遗留问题 • 后续研发工作 • 人员管理规定 • 项目管理规定
成果及遗留问题 • 成果 • 核心系统 • 明确了LaUDMS架构 • 底层存储:实现了Cassandra上的虚拟文件系统,封装了统一的存储访问接口 • 文本检索:对Katta和Zookeeper进行了测试,发现并解决了部分问题 • 特征提取:实现了图像特征及文件元数据的提取 • 高维索引:实现单机版的高维索引系统 • 查询引擎:实现了重构 • 开发社区:已经可以用于项目开发和管理 • 应用:图片及学术搜索具有了简单的功能
成果及遗留问题 • 遗留问题 • 核心系统: • 底层存储:稳定性测试、MapReduce功能实现 • 文本检索:Bug定位 • 特征提取:增加视音频特征提取算法,完善特征提取算法,并实现分布化 • 高维索引:增加分布式索引策略 • 查询引擎:开发应用,完善性能,调研CQL架构 • 应用: • 图像检索:提高检索准确率,提升响应速度,增加新的检索功能(如:人脸、性别等判断) • 学术搜索:可用,完善功能 • 社区:完善优化
提 纲 • 封闭开发成果及遗留问题 • 后续研发工作 • 人员管理规定 • 项目管理规定
后续研发工作(1) • LaUD3.0的A/B版发布: • 加强代码管理能力,确定LaUD3.0的A/B版,给出明确的版本说明 • 以8月24日演示的系统为基准,各模块确定相应代码,进行统一的代码管理 • 杨和东、朱笑尘负责,各小组配合 • 演示系统部署:保证演示系统长期可运行 • 外来人员参观,随时可演示(包括演示系统硬件环境) • 衣国磊(需找一个人备份)负责,各小组配合 • 8月31日前完成
后续研发工作(2) • 9月1日后的开发推进思路 • 继续完善自底向上的LaUDMS开发 • 确定各小组的科学问题——长远的理论研究 • 明确各小组的技术攻关方向——短期要解决的技术问题 • 加强自顶向下的应用开发 • 针对盘古搜索的具体应用:撰写需求分析报告、算法设计与研制、系统概要设计、系统详细设计、执行应用开发 • 针对性解决应用开发发现的LaUDMS中各个模块的问题
后续研发工作(3) • 自底向上的LaUDMS开发组的小组划分(固定) • 六个任务组(确定小组长): • 云存储:朱妤晴 • 图像:林梓佳 • 文本:张君 • 过程:金涛 • 查询引擎(架构、查询处理、查询优化):卓安 • 应用开发:秦锴 • 两个支撑组(确定小组长) • 开发社区:杨和东 • 系统测试:杜乃乔 • 总体组(系统架构)
后续研发工作(4) • 自顶向下的盘古搜索应用开发的小组划分(动态): • 底层存储组,组长:朱妤晴(如出国,衣国磊) • 支持至少1Billion的图像存储 • 为上层检索提供MapReduce服务及通用接口 • 图像特征提取及检索组,组长:林梓佳 • 根据盘古产品模式,测试选择图像特征提取方法 • 实现海量图像特征的分布式高维索引 • 实现基于图像内容的快速、准确检索 • 文本检索及挖掘组,组长:张君 • 提供基于关键词的检索功能(如出版物搜索应用) • 提供海量数据的挖掘模块 • 服务接口组,组长:秦锴 • 封装底层的存储和检索接口,向应用层提供统一的方法接口 • 与盘古开发人员沟通,明确任务接口 注:组之间分工协作,组长和组员双向选择,部分组员需要跨组执行任务,优先保证应用开发的进度
后续研发工作(5) • 后续的专利申请 • 底层存储,系统架构,文本索引,高维索引 • 软件著作权申请 • 后续的论文撰写 • WWW2012:2011年11月1日 • SIGIR2012 :2012年1月16日 • KDD 2012,ICDE,IJCAI,AAAI • TKDE、PAMI、TMM、TIST、TIP、CSVT… 注:系统英文全称:LaUDMS,专利和软件著作权以此为准 中文名称备选:立德,立得, 云数据管理系统
后续研发工作(6) • 2011年9月5日(星期一)——立地(开发LaUDMS) • 由组长牵头确定各小组技术开发点 • 开全体会议,讨论9月份工作计划 • 2011年9月19日(星期一)——顶天(UDM理论) • 由组长牵头确定各小组科学问题,理论研究方向 • 开全体会议讨论各小组理论研究点,梳理课题组长期研究方向
提 纲 • 封闭开发成果及遗留问题 • 后续研发工作 • 人员管理规定 • 项目管理规定
人员管理规定 • LaUD开发组人员进出规定 • 进组 • 自我推荐和小组长选拔的方式提出申请进入开发组 • 听从小组长的任务安排 • 明确个人工作计划 • 最后由老师确定是否进入开发组 • 出组 • 因找工作、写毕业论文等,不能保证工作时间时,主动申请退出开发组,由老师确定是否允许退出开发组,或半工 • 因态度问题不能按时完成研究计划,影响整体进度时,强制退出开发组 • 开发组人员统计——刘亮负责
提 纲 • 封闭开发成果及遗留问题 • 后续研发工作 • 人员管理规定 • 项目管理规定
项目管理规定(1) • 每月第一周的周一总结上月工作及制定本月工作计划(只讨论开发计划) • 由小组长及其组员确定小组月工作计划 • 每月第一周的周三之前在开发社区发布各小组月工作计划 • 小组长每周日晚12点前,汇总小组工作进展,提交周工作汇报(通过开发社区) • 小组成员每天按规定到实验室签到,执行请销假机制 • 刘亮负责 • 每周四下午进行一次小组的开发工作讨论与总结 • 小组成员每天上午至少查看Wiki上的通知页面,根据通知要求按时完成相应动作 注:刘亮每月的第一周协调王老师的时间,预定好会议室,下发开会通知
项目管理规定(2) • 开发组补助与奖励机制 • 由王老师根据LaUDMS研发的进展及应用开发的进展确定LaUD开发组的当月整体补助金额 • 计算方法为,开发组月补助总额为:(1 + alpha)*人均补助*人数,其中alpha由王建民老师根据开发组本月贡献及进展确定,取值范围为-1~1 • 以小组为考核单元,根据小组当月贡献及人员情况核定小组获得的补助 • 小组成员补助分为三个部分:基本、出席和绩效,小组长确定每人的工作量,根据工作量进行绩效补助的分配 • 每月选出0~2个特别贡献小组,进行小组奖励(奖金与物质奖励结合)每月选出0~2个特别贡献个人,进行个人奖励(以物质奖励为主) • 体育活动:开发组每周订一场羽毛球场地,每周支持一次游泳票 • 团队情感建设:每月开发组组织一次聚餐,每学期举行一次郊游 注:特别贡献评选老师和学生联合投票方式(是否社区可支持)
总结 • 近期需要同学做的工作 • 8月31日前:LaUD3.0A/B 版定版入库,演示系统稳定 • 9月5日前:小组长确定小组成员,制定小组月开发计划备会上讨论 • 9月19日前:小组确定小组研究的科学问题,明确研究方向和攻关点 • 人员统计 • 刘亮负责人员及后勤的管理,每月从小组长那里确定人员的变化情况,汇总