网路上这么多内容Google怎么决定谁排第1?揭发搜寻引擎的排名公式

当你在Google搜寻时,你知道Google如何决定跳出来的内容排序吗?

「影响排名最强的2大因素:1. 内容2. 指向自家网站的连结。」─ Google工程师20

在还没那么久以前的90年代,搜寻引擎是废物。虽然没有到完全不能用的程度,但比如你输入「白宫」,会找不太到美国总统府,反而会看到色情网站。因为经营那家成人事业的公司在他的网页里面,塞了上万次「白宫」这个关键字。

史丹佛大学里有2个学生发现搜寻引擎超难用的这个问题。他们说:「我们要开发全新的搜寻引擎,目标100亿营收。」100亿通常是很离谱的数字,连市值都不敢喊这么高,但这2位学生做到了。

他们是赖利• 佩吉(Larry Page)和谢尔盖• 布林(Sergey Brin ),Google搜寻引擎的共同创办人。这2人发明出「页面排名」的数学公式:排名最好的应该是「被引用最多次」的那一页才对。

他们在搜寻引擎里面加入这些公式,大家觉得超好用!排名最高的网页都是品质好、有权威的页面。Google也因此成为搜寻引擎市场的龙头,辗压所有在座竞争者,一直称霸至今。

谁是大咖,看谁被引用最多次

你可能知道,想要判断哪一篇论文更强大,大家是看「引用次数」。

假设我是个很混的学生,缴交品质不怎样的论文,那写完之后就会埋没在学术海里面。而你却想出划时代的新理论、登上重量级的论文期刊,给众多好手一起评鉴。这时候,其他认同你的作者,就会在他们新的著作里引用你的论点,作为发展立论的基础。

当你得到很多引用次数,尤其被产业界的学者、得过诺贝尔奖的大咖引用,那你就会变大咖,你的论文就值得更高的排名。

这里有一堆书,要怎么知道谁最该排第一?看谁被「引用」最多次就知道了。

《逆思维》(Think Again)引用了《快思慢想》(Thinking,Fast and Slow)的概念,《解决问题的人》(See, Solve, Scale )也引用了《快思慢想》…… ,那我们就知道:被多次引用的《快思慢想》很重要喔!

所以,怎么决定哪一个网页该优先被排序?看看这些页面有没有被「连结」就知道了。当你写一篇部落格文章,插入一个通往《维基百科》的连结,你就引用了《维基百科》,为它投下「信任的一票」。信任值越高的网页,排名表现就越好。查询到良好品质的页面越多,使用者就越离不开搜寻引擎。

Google发现这个机制实在太好用了,根本「戒不掉」!它把每个页面都标上引用分数,奖励那些拥有大量连结的网站,让大咖网站上新增的页面也能高速排名。Google把「连结引用」的信任机制,深深刻在自己的核心系统里。

「洗连结」的漏洞

有规则,就会有漏洞。投机的行销人看到这招,纷纷祭出各式各样「洗连结」的花招,让自己的页面得到很多很多的反向连结,真是太棒了!

这些花招包括:雇用工程师,创造1,000个网站、10万个页面,里面全部灌入废文,但彼此也像蜘蛛网一样串成「连结网络」。最后,再把这些连结讯号,灌进最想排名的那个关键字页面上。

又比如: 派一堆工读生到别人论坛、部落格底下留言, 说:「写得真好, 这是我的网站『白宫』, 连结是:http://……。」于是,网路上开始充斥一堆烂页面,在连结操纵之下得到超强排名。

人类又再度回想起输入「白宫」找不到美国总统府,整个页面却被色情网站支配的恐惧。

猫抓老鼠的惩罚机制

有规则,就会有漏洞,也就永远都有「猫抓老鼠」的戏码在上演。

Google运用资本主义的强大资源,开发出前所未有的深度排名演算法。他们雇用一整票拥有顶尖头脑的工程师打击滥用页面,买下惨虐围棋世界冠军的AI公司,把AI技术用在搜寻引擎。所以,那种明显粗糙的连结滥用手段、塞个几十万则连结的做法,直接受到了Google的严厉惩罚。

被标记滥用的页面和网站,排名都被砍到见血,甚至从搜寻引擎中消失。许多依靠这些连结操纵手段维生的事业也应声倒闭。

而那些擅长猫捉老鼠游戏的资深玩家,又研发出更微妙的连结方式:

.连结交换:你连我、我就连你

.金钱连结:撒钱给专靠连结获利的商人,你出钱、我来连

.赞助连结:付钱太露骨?那就赞助免费商品、赞助活动交换连结吧

这些更隐晦的做法增加了猫抓老鼠的难度,也模糊了滥用的界线。虽然看不到以往的猖狂,但聪明的成人网站经营者,依然有办法用「升级版」的策略,提升自家网站的权重指数。

被惩罚?反正我有的是钱,换个网站重新再来就好。

经过10多年的迭代进化,Google使用能「自学」的专门AI 专注在快速辨识、消灭连结漏洞。就像围棋一样,看似复杂的连结操纵,都是有固定轨迹可循的。

比如说连过去的页面,很刚好都是赚钱的关键字页面,比如说常常短时间内涌入大量连结……对AI 来说,只要读懂对方的「呼吸」,并且扰乱对方的「呼吸节奏」就能胜出。

Google宣称,它现在不用再投入大量人力审核、惩罚了。

只要被AI 辨识到有「作弊」的轨迹,那么这些连结造成的不当排名效果,就会被即时抹除。

真正的机制:信任

搜寻引擎和「优化师」共同追求的极致是「信任」。只要你写的内容够屌、能和《维基百科》拼搏,大家就会愿意插入连结、介绍他的读者到你的页面,因为引用你的意见就是引用专家意见。把你写的好书分享给我的朋友,同时象征了我很有学问。

说穿了,能够永久提升排名的机制,就是同样的核心原则─创作编辑认可。没通过这个标准的,就不算高品质的引用连结。

当你在写文章的时候,你会参考维基百科、会翻找知名媒体新闻网,身为创作者的你,会「自愿」插入连结引用好的资讯。但你几乎不会去挖掘某个不知名的小作家,用连结指向他的论述。

因为你会愿意引用的,是高权威性、高专业度、可信的资料来源。能取得这种连结,对排名的加分效果可说是「霸主」等级。「连结」影响搜寻引擎的程度,就如同武林当中的至尊:得连结者,得天下。

知道连结的重要性,就先赢一半。

有太多杂七杂八的「SEO 优化因素」,但就算它们全部叠加在一起,只要对上高品质连结,效果可以说是不堪一击。谁搜集到最多编辑认可的连结,谁就是权威、谁就能享有顶级的排名表现。

只是,「连结」通常被严重低估,因为它的构成逻辑相当复杂。但从科学实证来看,连结对排名表现来说,有确实显著的统计意义。如果关键字排名是一场考试,「连结」就像是试卷背后配分超高、难度也高的题型。

在这场考试里面,大部分的考生都没发现后面还有题目,你「知道」连结这件事,就赢在起跑点上了。

发表评论

滚动至顶部