起因:不太常用网盘,今天蹲厕所前想拷个PDF到ipad上,用了女朋友的百度云
过程1:偶然的发现,PC端上传异常快,没有等待的过程基本上(PDF大小137M),鄙人2M的渣带宽,怎么也得有个几分钟上传的过程吧
过程2:ipad开始同步离线文件,直接就开始了下载,根本没有等待的过程
猜想:从过程1来看,显然是云端并没接收我的PDF,PDF源文件是网上下的较流行的电子书,未做修改。想来是通过计算hash值或其他方式指向云端的已有资源
实验:为证实猜想1,将PDF与一私人文件打包,再次共享,果然在短暂停顿后,上传开始
思考1:百度云此举显然提升了用户体验,相同文件云端直接下载,免去了等待上传的时间;其次同一文件云端存储单一副本节约了云端的空间资源
思考2:文件同步作为百度云的用户行为,可以为百度提供大量大数据和机器学习的基础数据
思考3:通过对没有分类或分类较单一的文件信息和用户间的关系,可对云端文件群进行聚类分类处理,包括私有文件和公有文件的识别
思考4:同样可以从用户的角度进行此项工作,从关系识别出用户的喜好特征,从而进行推荐等工作
思考5:再通过百度产品线间的数据共享,结合检索历史,音乐盒,移动应用信息等等。。。
呵呵呵
PS:如果将来推荐真的出来了,那传几个喜欢的岛国动作片上去岂不是就相当于新番订阅了:)
原文地址:http://www.cnblogs.com/satzcoal/p/4006382.html