从论坛和知乎看内容社区的信息过滤机制
在内容型社区上,用户的使用体验主要取决于他得到的信息对于他而言是否有价值的,一旦社区的垃圾信息增多,信噪比降低对于社区的影响是致命的,所以每种形态的内容社区都有它的信息筛选机制,下面以天涯/贴吧为代表的传统bbs和问答社区知乎为例探讨一下内容型社区的信息过滤该怎么做。
BBS的做法
在传统的bbs中,信息依据它的时间属性进行排列,每个新发布的主题或者获得新回复的主题都会被放置到更显眼的位置使用户更容易获取,由此来保证整个社区内信息的新鲜程度和用户的活跃程度。这种机制使信息的排列展示完全依赖于单一的时间维度,而对于本身信息的质量无法评判,所以在这种情况下,通常用以下常见的手段来保证bbs社区内部的信息质量:
领域细分化:在社区发展初期,用户数量比较少,用户因某种共同的目标或者相似的特点聚集在社区上,这个时候社区是小众的。但是后期用户大量涌入,用户与用户之间的相似点,使用目的差别会越来越大,这时候社区上的信息冲突就会不可避免的发生。所以为了保证整个社区的正常运转,很必要的就是根据对用户使用情况的观察,将社区拆分成越来越精细的版块,通过用户的兴趣,身份,目的等等对用户群进行细分,保证各个用户群之间不会被其他群体所产生的信息干扰。而在同一主题板块内部展示给用户的信息都是相同的,本质上来讲,bbs所采取的方式一直是以主题为导向,不同的主题板块之间处于封闭状态,以此来换取同一类用户交流的效率。
强力的运营手段:即使交流的领域被细分了,但是仍然不可避免的会有垃圾信息的出现,这个时候就一定要进行人工审核了,所以几乎在每一个内容型社区之中都会有专门的运营人员负责内容的监管,除了由官方人员负责外,在bbs之中最常见的就是版主机制,在每一个交流版块上都会选择部分优质的,活跃的用户担任版主,起到社区领袖和信息审核的作用。
以论坛bbs为代表的这类传统的内容型社区大多是依靠上述的手法,将领域细分化,用户群之间封闭化和采取单向性,中心化的运营管理手段来保证产生内容的质量。
这种依赖人工来进行管理的手段需要比较高的运营成本,在论坛上能够使贴子获得更高展示权重的因素仍然是回复的“量”而不是本身的“质”,这就意味着一个贴子能够成为热门的原因往往是贴子的话题性,这使得整个论坛仍然很易于“水化”:一个作者精心准备的优质资料贴往往得到小部分人的称赞后便不再收到回复,慢慢沉下去。但另外一个话题性较强,但实际内容粗俗的骂战贴,攻击贴却往往能引发用户的大量回复,长期占据在主题列表的前列。
这和bbs本身的产品形态有关,bbs走的就是”等权重,低门槛,高活跃度”的产品路线,对于用户与用户以及内容与内容之间并不进行质量的区分,只是单纯的依靠时间作为排列依据,保证每一个用户能够快速的参与进社区的讨论中,这样能够有效降低门槛和增加活跃度。但不足之处就是非常依赖运营的手段来进行信息筛选。
知乎的做法
知乎给自己的定位一直是高质量的网络问答社区,既然想要做到高质量,那么对于社区两大重要元素:信息流和用户关系就有着更严格的要求。为了保证这一点,在发展的初期团队采取的策略是将社区封闭化,不开放公开注册,用户只能通过定量发放的邀请码进行注册,用这种严格筛选的方式保证社区初期种子用户的水准以及用户间的互动质量。
随着知乎的发展,特别是当知乎开放注册之后, 也会面临所有内容型社区都会面临的一个严重问题:用户大量涌入导致社区的内容产生变的不可控,严重冲击原先的社区定位。特别是像知乎这类强调“高质量”的社区,一旦出现用户大量涌入冲击社区本身的定位等情况无疑将会是一个致命性的打击。关于这个问题,知乎的创始人周源在参加分享活动的时候做出的解答是用户数量并不一定是内容质量的敌人,信息流动速度变快以后的信息泛滥才是。也即,在一个内容型社区上,真正重要的是确定一个优秀的信息组织方式。
现在的知乎版本有如下内容会被推送到用户的主页上:
我关注的话题下的某一问题
我关注的话题下某一问题中的某一回答
我关注的用户的回答
我关注的用户赞同了的回答
我关注的用户所关注/发起的问题
从产品上来看,知乎的核心就是“问-答”,但是和百度知道不同的是,百度知道上回答问题是为提问者一个人服务的,当提问者选择一个回答变为最佳答案时,问题的流程就已经结束,剩下的只是将这个封装好的问题-回答借助搜索引擎的关键字检索能力分发给有类似需要的提问者。而知乎上提出的问题本身不单单属于提问者一个人,它是以一种开放性的姿态让用户前来撰写答案。而对于用户的回答,知乎采取非常民主化的“赞同-反对”机制让用户发起评判,再根据评判后的评分情况把认同度更高的回答放在更靠前的位置,由此来对优劣内容进行筛选。而且不管在什么页面,只要是显示出回答的内容也一定会把该回答获得的赞的数量显示出来,以此让用户对该答案的质量有直观的判断。“回答(用户产生的内容)+赞同数量(回答质量)+答主”是知乎上最基础也是最核心的内容展示形式。
在知乎的早期版本里,推送给用户的内容都来自于用户所follow话题,但在后来的改版中知乎由内容导向性开始向用户导向性转变,用户不仅仅是信息的制造者,同是也是信息流的组织节点。推送给用户的主要内容来源转变为用户所follow的用户。这样做最直接的结果就是各个领域之间的闭环被逐渐模糊,由原先的话题分割逐渐开放,本身在某一领域非常专业的用户可以“刷脸吃饭”,现在衡量用户的标准直接转变为用户的所获得的赞数和粉丝数量,这样在某种程度上降低了整个社区的专业程度:粉丝越多的作者撰写的回答会被推送给更多的人,得到的阅读量就大也就更有可能获得数量比较多的赞,那些粉丝数较少但回答更专业的作者得到的赞同数反并不高。在这里,我认为知乎团队可能因为如下的考虑决定做这种改版:
增加整个社区的信息时效性和流动性,如果有基于时事所引发的问题,或者非常热门的问题,这种人与人间的的传播可以使其他用户更快的发现。
增加推送给用户的信息广度,一个用户关注到另一个用户可能是因为他在某一领域的答案被认可,但是被关注的用户也会在其他的领域有兴趣爱好,他在其他主题下的回答也会被推送出去,有利于更多的优质内容被发现。
被关注用户的行为推送出去后是对关注他的用户有明显影响的,经过数据分析,大部分优质的用户在他们的行为上(比如对于其他答案的评判,自身答案的撰写)也都更加专业化,合理化。把他们的动态推送出去这样能加速用户获得优质信息,够带动整个社区网良性发展,这也是信息过滤的一种方式。
这种做法是否会降低用户获得信息的信噪比呢?最后,在“专业”与“社交”这两个方向上,知乎还是放弃了一点高冷,选择了让用户之间进行更深层次的互动。
还有一点值得注意,知乎上一直是在弱化“用户直接面对用户”这个概念,并没有出现像百度知道那种专业领域认证勋章,也没有像果壳那样有专门的栏目直接列出优秀的回答者。可以说,知乎上所有对于其他用户的认知都是来自他所产生的内容,用户的身份并不单独凸显。知乎首页的feedline虽然大部分的内容都基于自己关注用户的动态,但是他新关注了哪些用户这一类动态却并不显示。个人认为这是因为知乎想要将用户和他的回答这两个元素更紧密结合,用户的回答是对他本身专业程度的背书,另一个用户对于他是否认可是以他产生的内容作为依据来判断的,脱离了用户产生的内容而直接谈论用户的专业性是没有意义的。
同时,我所关注的用户是会影响我的feed流内容的,因此不直接引导用户去关注那些较专业的作者,而是让用户判断其他用户的路径变长,经历“阅读回答—对答主产生兴趣—关注答主”这一较长的判断流程后再去判断他所follow的用户是否是自己真正需要的。
简单的总结,在知乎上对于一个用户的质量判断,在根本上是赞数为回答背书,回答为用户背书。
作者:宋仔
立即登录