仓酷云

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
仓酷云 门户 程序员 移动互联 查看内容

大数据次要是做三件事:对用户了解、对信息了解、对关系了解 ... ...

2015-1-29 08:40| 发布者: 第二个灵魂| 查看: 141| 评论: 0

摘要: 大数据主要是做三件事:对用户理解、对信息理解、对关系理解   大数据这个概念提了好多年。每次提到大数据的时候,都是个性化、精准化,大家能想到的就是这些。在很多年前,IBM和很多大互联网 ...
毫无疑问,中国的金融业态正在发生深刻的改变。

大数据次要 是做三件事:对用户了解 、对信息了解 、对关系了解

大数据次要 是做三件事:对用户了解 、对信息了解 、对关系了解 ,互联网的一些事

  大数据这个概念提了很多多少 年。每次提到大数据的时分 ,都是特性 化、精准化,人人 能想到的就是这些。在良多 年前,IBM和良多 大互联网公司都在提这个话题。然而 它真正产物 化或 贸易 化的价值,是在2011、2012年今后 才有了迸发 性的增加 。

  它有一些缘由 :

  第一个是这两年的确 是跟着 社会化媒体的普及、数据的量迸发 式的增加 。人人 天天 在网上分享的文字、图片、视频,它的数据的范围 要超越 咱们 汗青 上任什么时候 期。有价值的信息也愈来愈 多。汗青 上,良多 年前人人 上互联网,信息不过 就是各类 网页,小网站、大网站。信息的价值不像如今 这么充实 。如今 太多的信息反应 了列位 的念头 或 列位 的乐趣 特点 。好比 说我儿子三岁,我常常 会发我儿子的照片,发一些养孩子的心思 感触感染 。了局 他就曝露了我乐趣 的偏向 。这对咱们 数据的使用 会很有匡助 。不像之前 你顶多看各类 各样的网页,各家的网页也没有举措 一致 做大数据的剖析 。

大数据次要 是做三件事:对用户了解 、对信息了解 、对关系了解 ,互联网的一些事

  还有一个对照 主要 的一点,也是我感到 对照 深的一点是开放。咱们 之前 提到特性 化,人人 听过最多的有关大数据的案例就是沃尔玛的尿不湿,那就是大数据的雏形,假如 咱们 把这个数据应用 到网站说,人人 想到最多的就是隐私。由于 你的乐趣 喜好 冒犯 了我的隐私。然而 如今 微博、Twitter,facebook,良多 社交化媒体的典范 特色 是开放的。QQ和微博最大的区分 是,QQ的关系链,你的伴侣 是谁,人人 是不晓得 的,条件 是这是你的隐私。然而 微博,你收听了谁、存眷 了谁,你发的每 条微博一切 人都看失掉 。你利用 这个产物 ,相当于你签了一个协定 ,我要开放。不克不及 说你在这个基本 上做一些数据的使用 是侵占 隐私,这个在实际 上是不成立的。由于 每一个 人的特点 ,哪怕手艺 不去做,咱们 用肉眼把你的微博拉上去 看一下,也也许 能看一下你的范畴 ,或 你的乐趣 。这也给咱们 做大范围 数据发掘 使用 供应 了一个十分 大的条件 。隐私的成绩 在产物 构成 之前就处理 了。

大数据次要 是做三件事:对用户了解 、对信息了解 、对关系了解 ,互联网的一些事

  我这里复杂 列了一下微博的数据情形 ,咱们 天天 发的微博,还有图片,如今 都是以数百亿的来盘算 。这外面 有一个,除 你发微博自己 ,还有一个主要 的就是社会收集 ,就是你的人际关系。在QQ的时分 是没有举措 做剖析 的,由于 他是有隐私的。然而 微博十分 好的一点,你的社会关系咱们 可以很宁神 的来利用 。由于 是公然 的。在腾讯微博如许 一个产物 外面 ,你会发明 社交关系的数目 到达 了三百亿的量级。这外面 有一个传布 途径 ,你发了一条信息,它的传布 的能够 性轨迹,到达 了万亿级其余 途径 。这就是一个很大的大数据。人人 很难想象,微博如许 一个产物 ,如许 大的一个产物 系统 外面 ,咱们 具有 近千台的办事 器用来盘算 ,还不是用来做产物 ,不是用来供应 办事 ,只是用来做离线的盘算 ,运算出各类 公式和了局 ,就需求 近千台办事 器。这些办事 器和几年前的办事 器功能 、范围 都有很大的区分 ,每台办事 器的存储空间都无数 个T,咱们 有近千台数个T的办事 器做运算。这么复杂 的一件工作 ,就需求 近千台办事 器匡助 人人 运算,你究竟 跟哪一个 人多是 伴侣 ,究竟 跟哪一个 人是你感乐趣 的范畴 。在那六合 震的时分 ,咱们 疾速 的剖析 出,运算一下如今 有哪些地动 情形 ,仍是 蛮成心 思的,地区 的散布 ,这些都是大数据的应用 。大数据有两大类数据可以用。第一类是微博外面 十分 主要 的,你宣布 、收听和存眷 这些全都是公然 的。有一局部 影视数据是典范 阅读 行动 。这局部 仍是 牵扯到使用 情形 。所以用的慎重 一些。

大数据次要 是做三件事:对用户了解 、对信息了解 、对关系了解 ,互联网的一些事

  大数据能做甚么 ?咱们 那末 多中央 切磋 大数据,不过 总结上去 就做三件事:

  第一,对信息的了解 。你发的每 张图片、每个 旧事 、每个 告白 ,这些都是信息,你对这个信息的了解 是大数据主要 的范畴 。

  第二,用户的了解 ,每一个 人的根基 特点 ,你的潜伏 的特点 ,每一个 用户上彀 的习气 等等,这些都是对用户的了解 。

  第三,关系。关系才是咱们 的中心 ,信息与信息之间的关系,一条微博和别的 一条微博之间的关系,一个告白 和别的 一个告白 的关系。一条微博和一个视频之间的关系,这些在咱们 肉眼去看的时分 是绝对 复杂 的。

  好比 有条微博说这两天朝鲜绑架咱们 船的事,那条微博也也许 是谈这件事的。人眼一眼就可以 看出来。然而 用机械 怎样 能看出来这是一件事,和 他们之间的因果关系,这是很有难度的。然后就是用户与用户之间的关系。哪些人你情愿 收听,是你的伴侣 ,哪些是你感乐趣 的范畴 ,你是一个音乐达人,你是一个吃货,谁人 用户也是一个吃货,你情愿 收听他。这就是用户与用户之间的关系了解 。还有效 户与信息之间的了解 ,就是你对哪一类型的微博感乐趣 ,你对哪一类型的信息感乐趣 ,假如 牵扯到贸易 化,你对哪一类的告白 或 商品感乐趣 。其实就是用户与信息之间的关系,他不过 是做这件事。

大数据次要 是做三件事:对用户了解 、对信息了解 、对关系了解 ,互联网的一些事

  大数听说 的那末 悬,其实次要 是做三件事:对用户的了解 、对信息的了解 、对关系的了解 。假如 咱们 在这三件事之间还要提一件事的话,一个叫趋向 。他也是关系的一种变种,只是关系略微 远一点,情绪 之间的剖析 ,还有咱们 当局 部分 做的舆情监控。他可以监控大范围 的数据,可以剖析 出人的意向 。在美国的好莱坞,这两年也是基于FACEBOOK和TIWTTER的数据来展望 行将 上映的片子 的票房。他也是一个趋向 的剖析 ,只是咱们 把这个趋向 提早 来。中心 就是这三件事。

  为何 要讲这些呢?

  由于 这些在咱们 新版外面 都有很充实 的表现 。咱们 的新版要做甚么 。新版中心 是要做进步 浏览 效力 这件事。微博自己 的形状 就是很碎片化的。这个碎片化还不是由于 人人 上彀 的工夫 碎片化,我指的是信息的碎片化。微博就是那一百来个字,你收听、存眷 了哪些人都是很随机的,你看信息长短 常琐细 的。你看到一件工作 的时分 根基 上不成 能在微博上看到它的全貌。一团体 说了几句,金三胖真过度 ,又抓咱们 渔平易近 ,你能晓得 这件事是甚么 吗?你要想晓得 这件事是甚么 。高真个 人还可以搜一搜,捣腾 这件事。关于 一些小白来讲 ,他基本 不晓得 这件事是甚么 。旧事 门户这个时分 就很主要 。旧事 门户我点来点去,他也许 就可以 看出这件事是甚么 。这和产物 自己 有关。然而 也和这两年跟着 人人 上微博愈来愈 多,信息爆炸、信息过载有关。如今 我收听了一千多号人,假如 非常 钟不看的话,就必定 是一百条以上没有看。有良多 我存眷 的信息也能够 漏掉 在这一百条,或 几百条信息外面 。几百条外面 有大批 的营销、笑话、段子,我很感乐趣 的我的前女友的静态 就被这些段子沉没 出来 了。然而 我的前女友又不太活泼 。她乃至 一两个礼拜 才发一条微博,根基 上很好看 失掉 。这就是咱们 微博产物 自己 的特色 。所以咱们 经由过程 几个功效 来处理 信息获得 的效力 。第一个是从内容的角度对微博停止 分类,咱们 的频道是经由过程 内容的角度把内容归类,把优良 内容提掏出 来。微热门 也是从内容的角度把内容停止 分类。庐山地动 ,他人 只提了几个字,在你的顶栏外面 就会呈现 庐山地动 的内容,这是对内容停止 分类。第二,从人的角度把信息分类,咱们 新版会推出一个器材 ,叫微圈,他是智能的分组。特别 是咱们 这些对照 活泼 的人,你能够 收听了八百、五百人,你有无 耐烦 一个一个的分一个组?这是很难的,大局部 人不会做这件事。所以咱们 是智能的分组,你甚么 都不必 管,直接帮你分好。我的前女友我可以建一个前女友群,我要看她的动静 ,我就点到谁人 群里,可以分类的看这些人的静态 。

大数据次要 是做三件事:对用户了解 、对信息了解 、对关系了解 ,互联网的一些事

  举一个对用户了解 的才能 ,人人 都晓得 李开复是如许 的,人人 都晓得 他在微博外面 有这么多咱们 可以剖析 的手艺 的点。这些点牵不牵扯到隐私?你去他的网页上看一看也能够 失掉 这些结论。只是这么多的点,你能不克不及 凭使用 剖析 出来。

  最初 再总结一下大数据是干嘛 的。

  这两年再怎样 提大数据,它和汗青 上呈现 的很多 手艺 一样,它只是一种才能 和手艺 罢了 ,只是一种东西 罢了 。只是这两年因为 数据范围 的扩展 ,和 基于大数据出生 了良多 新的产物 和贸易 化的形状 。所以咱们 才这么火的来提它。其实它还只不外 是一种东西 罢了 。咱们 的总结是基于大数据处理 用户的需求,供应 一种最优良 的办事 才是终究 方针 ,大数据只是东西 罢了 ,并没有那末 悬。

  在今朝 为止,基于大数据的使用 大都还局限在贸易 化为主。更多的仍是 提怎样 做精准告白 ,怎样 做商品保举 ,怎样 做这些这些。真正敢把它做产物 化的还对照 少。由于 一切 的大数据这些智能的器材 都有一个特色 ,不是百分之百的正确 率。不像你要做一个甚么 样的产物 功效 ,按纽放哪就放哪,不会有毛病 。大数据的特色 是它只能做到必定 的正确 率,你敢不敢产物 化,取决于你对这个才能 的正确 度进步 到甚么 水平 。就以咱们 此次 微圈举例,或 以微热门 举例,假如 你把一个用户智能分组只能正确 到50%、60%。了局 是拔苗助长 的。你把热门 的聚类聚在一同 ,而且 和你主页上的信息婚配 的时分 ,你的正确 率敢不敢做到80%、90%以上?这就是为何 我入手下手 跟人人 讲大数据。其实就是第一次咱们 也是大范围 的把大数据这类 手艺 的才能 和腾讯对数据独有的数据范围 的优势使用 到产物 中去。

线上服务与线下服务融合,社交场景与生活场景交互……这一切都说明了,融合无处不在。

路过

雷人

握手

鲜花

鸡蛋

最新评论

QQ|Archiver|手机版|仓酷云 鄂ICP备14007578号-2

GMT+8, 2024-12-28 20:12

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

返回顶部