我们生活在物质世界,在物质世界的人评价互联网世界的思维,和外星人评价地球人思维是一样的。所有专家和大佬们总结的互联网思维,都有一定的道理。搜刮 引擎若何 完成 用户图片检索的需求知足1、 甚么 是需求知足 1.1 甚么 是需求知足 用户来搜刮 “章鱼 保罗”,就文原形 关性而言,搜刮 引擎只需 前往 和“章鱼 保罗”内容相干 的了局 就能够 了,如许 用户是不是 写意 呢? 用户甲:传闻 章鱼帝挂了,来看看最新了局 ,怎样 满是 8月份的,往后翻页中… 用户乙:明天 同事们在会商 章鱼哥挂了,章鱼哥是啥?我又out了,来搜刮 一下章鱼帝生平业绩 是啥,怎样 满是 最新的了局 ,没有章鱼哥的引见 啊,变换个query看看 用户丙:我是铁杆球迷,看完章鱼哥,再看看足球相干 的吧,鲁尼,杰拉德是不是 又进球了,怎样 连个相干 保举 都没有,还得我亲身 输出 。 用户丁:找个章鱼哥的头像用一下吧,必定 很拉风,怎样 满是 了局 没无方 图呢,这么扁的图怎样 用啊 用户戊:换个章鱼哥的壁纸,或许 下次买彩票能发大财,咦,怎样 满是 小尺寸的图… (以上信息经由过程 剖析 2010-10-27用户session得出。) 笼统的说,用户向搜刮 引擎表达他的需求,搜刮 引擎了解 用户需求,供应 各分歧 的需求下的资本 ,这全部 进程 可统称为需求知足 。复杂 说,就是除 基本 文字相干 性以外 的rank任务 ,都属于需求知足 的范围 ,也就是说,供应 给用户的检索了局 ,不单单 请求 在字面上是和用户输出 的文字相干 的,还要知足 用户的各类 分歧 需求。 需求知足 在rank系统 中所处的地位 :
1.2 为何 需求 需求知足 用户经由过程 query表达了本人 的需求,而关于 大局部 query来讲 ,特别 是具有隐含需求的query,仅仅字面婚配 的查询了局 未必可以 知足 其需求。今朝 咱们 的排序体系 是次要 是基于文原形 关性这个维度的,权值表现 了query中的term与obj的相干 水平 ,在这个别 系下,相干 的了局 未必可以 知足 用户需求。 例如后面 提到的“章鱼 保罗”的例子,明显 ,这些需求在文原形 关性这个维度下很难处理 ,特别 触及 到突发时效性需求,泛需求等。1.3 需求知足 包括 哪些任务 从下面 的例子中,可以看出,需求知足 需求 处理 时效性需求成绩 ,多需求成绩 ,相干 保举 ,size需求,素材类需求,阅读 引诱 等成绩 。除 基本 文原形 关性之外 的rank战略 和 为了这些所做的query剖析 任务 可以为 属于需求知足 的任务 ,别的 还包含 前端了局 展示 与用户引诱 阅读 的任务 。 Image需求知足 ,依照 分歧 的维度,可以划分为以下 几个方面: a.需求辨认 b.资本 建立 c.需求调权 d.了局 组织与保举 e.用户引诱 交互 2、 需求知足 若何 做 需求知足 要处理 的中心 成绩 : 需求辨认 资本 建立 需求调权 2.1 需求的辨认 2.1.1 需求的类型 辨认 query有哪些需求,和 需求的强弱,是最基本 的任务 。起首 要有需求的系统 ,能完整 的描写 各类 需求,其次是若何 辨认 这些需求,把每一个 query的需求对应到这个别 系中去。 基于统计的需求辨认 经由过程 对大批 的数据统计剖析 ,可以辨认 出query有哪些方面的个性 。可供剖析 的数据良多 ,好比 用户行动 数据,点击反应 ,检索了局 等。 好比 :搜刮 “章鱼 保罗 壁纸”,经由过程 统计用户点击图片的长宽数据,发明 用户点击的图片,大局部 是长宽对照 大的图片,而“章鱼 保罗 头像”则恰好 相反。 又好比 经由过程 剖析 大批 用户的检索数据,发明 相当局部 的用户在检索“章鱼 保罗”以后 ,又检索了足球相干 的关头 词,那末 可以辨认 “章鱼 保罗”和足球有着很高的联系关系 度,在给用户保举 相干 搜刮 时,可以拔出 足球相干 的保举 。
专名&需求词 判别 query中包括 专名或 需求词等关头 词,是最直接的体例 。好比 “章鱼 保罗 头像”,用户在query中显示的表达了头像方面的需求,个中 就包括 了尺寸方面的需求,头像是需求 小尺寸的图,如右图所示,这时候 候出一张大的图片就不合适 用户需求了。 时效性需求 时效性需求的辨认 ,次要 是经由过程 用户检索量的突发和 资本 数的突发来判别 。 检索量的突发,可以经由过程 积累 每一个 query的天天 的用户检索频率,用一连 多天的用户检索频率,盘算 当天检索量和汗青 对照 ,是不是 有突发,进而判别 是不是 有时效性需求的强弱。资本 数方面的判别 ,可经由过程 相似 的体例 发掘 。 好比 “章鱼 保罗”,活着 界杯时代 ,该query,和 相干 query的检索量,比拟 世界杯之前,用户检索量有了迸发 性的增加 ,而且 延续 坚持 在高检索量的形态 ,则可以为 是有时效性需求的query。 2.2 需求的知足 辨认 出query有哪些需求,下一步的任务 就是供应 响应 的资本 。 2.2.1 资本 的发掘 若何 取得 知足 需求的资本 ,是需求知足 的另外一 个中心 成绩 。在资本 上,经由过程 某一个或 几个特点 组合,可以 把知足 请求 的资本 和不知足 请求 的资本 辨别 开,找到用户需求需求 的资本 ,去失落 不知足 请求 的资本 ,是次要 的任务 。 内容属性特点 对内容属性维度来讲 ,可以分为底层的物理特点 ,中层的物体辨认 和高层的语义特点 。 关于 底层的物理特点 ,绝对 对照 复杂 ,包含 尺寸,色彩 ,格局 ,明晰 度饱和度等,中层特点 ,有人与非人的,色情图片的,整车的辨认 ,手机图片的辨认 等;关于 高层的语义特点 ,包含 场景的辨认 ,图片作风 的辨认 ,情绪 的辨认 ,好比 是室内仍是 室外,是不是 非主流作风 等,都可以作为资本 挑选 的特点 。 话题属性维度 话题属性维度,是指植物 ,植物,帅哥,美男 ,军事,体育等等各类 分歧 的话题,咱们 但愿 把图片能依照 如许 一个分类停止 一个划分。 好比 ,经由过程 这个分类,咱们 可以晓得 哪些图片是头像类的,哪些是壁纸的,哪些是足球体育相干 的。用户在搜刮 “章鱼 保罗”时,可以保举 足球相干 的资本 。 时效性资本 的收录
时效性资本 ,可以很轻易 的经由过程 收录工夫 来判别 ,和非时效性资本 辨别 开。时效性资本 的来历 普通 包含 旧事 站点,各大服装论坛 ,bbs等社区类网站。 2.2.2 需求调权 明白 了query的需求,发掘 了知足 需求的资本 ,那末 若何 把知足 需求的资本 rank到前端呢? 关于 各类 分歧 的需求维度,都有本人 的调权的战略 。好比 “章鱼 保罗 壁纸”,咱们 辨认 出有尺寸方面的需求,那末 可以把尺寸对照 大的图片,停止 加权;又好比 时效性的需求,可以直接在前三页拔出 的时效性库的了局 ,这是由于 时效性需求是一个强需求维度,复杂 的加权,不克不及 包管 了局 调剂 到前三页。 今朝 这类 战略 直接叠加的调权体例 ,长处 是复杂 ,直接,弱点 也对照 多,最大的是不成 控,一个维度上的调权,会对最初 了局 形成 多大的影响,他说的话份量 有多大,不晓得 。 3、 结语 关于 需求知足 将来 ,要向智能化,主动 化,多样化的偏向 延续 开展 。咱们 终究 的方针 是把需求知足 这个偏向 做没了,需求发掘 ,资本 知足 全体 主动 化,做到“手中无剑 心中有剑”。 你这种互联网思维的定义,没有任何价值!这个名词本身就没有PHP网页编程价值,你希望我能如何创造出它的价值?还好我写了一篇废话连篇的文章来跟你讲,让你终于明白,之前听到的互联网思维,大多都是废话,不要太当真。 |
|Archiver|手机版|仓酷云 鄂ICP备14007578号-2
GMT+8, 2024-12-26 01:01
Powered by Discuz! X3.2
© 2001-2013 Comsenz Inc.