网路上这么多内容Google怎么决定谁排第1？揭发搜寻引擎的排名公式

Post Views: 20

当你在Google搜寻时，你知道Google如何决定跳出来的内容排序吗？

「影响排名最强的2大因素：1. 内容2. 指向自家网站的连结。」─ Google工程师20

在还没那么久以前的90年代，搜寻引擎是废物。虽然没有到完全不能用的程度，但比如你输入「白宫」，会找不太到美国总统府，反而会看到色情网站。因为经营那家成人事业的公司在他的网页里面，塞了上万次「白宫」这个关键字。

史丹佛大学里有2个学生发现搜寻引擎超难用的这个问题。他们说：「我们要开发全新的搜寻引擎，目标100亿营收。」100亿通常是很离谱的数字，连市值都不敢喊这么高，但这2位学生做到了。

他们是赖利• 佩吉（Larry Page）和谢尔盖• 布林（Sergey Brin ），Google搜寻引擎的共同创办人。这2人发明出「页面排名」的数学公式：排名最好的应该是「被引用最多次」的那一页才对。

他们在搜寻引擎里面加入这些公式，大家觉得超好用！排名最高的网页都是品质好、有权威的页面。Google也因此成为搜寻引擎市场的龙头，辗压所有在座竞争者，一直称霸至今。

谁是大咖，看谁被引用最多次

你可能知道，想要判断哪一篇论文更强大，大家是看「引用次数」。

假设我是个很混的学生，缴交品质不怎样的论文，那写完之后就会埋没在学术海里面。而你却想出划时代的新理论、登上重量级的论文期刊，给众多好手一起评鉴。这时候，其他认同你的作者，就会在他们新的著作里引用你的论点，作为发展立论的基础。

当你得到很多引用次数，尤其被产业界的学者、得过诺贝尔奖的大咖引用，那你就会变大咖，你的论文就值得更高的排名。

这里有一堆书，要怎么知道谁最该排第一？看谁被「引用」最多次就知道了。

《逆思维》（Think Again）引用了《快思慢想》（Thinking,Fast and Slow）的概念，《解决问题的人》（See, Solve, Scale ）也引用了《快思慢想》…… ，那我们就知道：被多次引用的《快思慢想》很重要喔！

所以，怎么决定哪一个网页该优先被排序？看看这些页面有没有被「连结」就知道了。当你写一篇部落格文章，插入一个通往《维基百科》的连结，你就引用了《维基百科》，为它投下「信任的一票」。信任值越高的网页，排名表现就越好。查询到良好品质的页面越多，使用者就越离不开搜寻引擎。

Google发现这个机制实在太好用了，根本「戒不掉」！它把每个页面都标上引用分数，奖励那些拥有大量连结的网站，让大咖网站上新增的页面也能高速排名。Google把「连结引用」的信任机制，深深刻在自己的核心系统里。

「洗连结」的漏洞

有规则，就会有漏洞。投机的行销人看到这招，纷纷祭出各式各样「洗连结」的花招，让自己的页面得到很多很多的反向连结，真是太棒了！

这些花招包括：雇用工程师，创造1,000个网站、10万个页面，里面全部灌入废文，但彼此也像蜘蛛网一样串成「连结网络」。最后，再把这些连结讯号，灌进最想排名的那个关键字页面上。

又比如：派一堆工读生到别人论坛、部落格底下留言，说：「写得真好，这是我的网站『白宫』，连结是：http://……。」于是，网路上开始充斥一堆烂页面，在连结操纵之下得到超强排名。

人类又再度回想起输入「白宫」找不到美国总统府，整个页面却被色情网站支配的恐惧。

猫抓老鼠的惩罚机制

有规则，就会有漏洞，也就永远都有「猫抓老鼠」的戏码在上演。

Google运用资本主义的强大资源，开发出前所未有的深度排名演算法。他们雇用一整票拥有顶尖头脑的工程师打击滥用页面，买下惨虐围棋世界冠军的AI公司，把AI技术用在搜寻引擎。所以，那种明显粗糙的连结滥用手段、塞个几十万则连结的做法，直接受到了Google的严厉惩罚。

被标记滥用的页面和网站，排名都被砍到见血，甚至从搜寻引擎中消失。许多依靠这些连结操纵手段维生的事业也应声倒闭。

而那些擅长猫捉老鼠游戏的资深玩家，又研发出更微妙的连结方式：

．连结交换：你连我、我就连你

．金钱连结：撒钱给专靠连结获利的商人，你出钱、我来连

．赞助连结：付钱太露骨？那就赞助免费商品、赞助活动交换连结吧

这些更隐晦的做法增加了猫抓老鼠的难度，也模糊了滥用的界线。虽然看不到以往的猖狂，但聪明的成人网站经营者，依然有办法用「升级版」的策略，提升自家网站的权重指数。

被惩罚？反正我有的是钱，换个网站重新再来就好。

经过10多年的迭代进化，Google使用能「自学」的专门AI 专注在快速辨识、消灭连结漏洞。就像围棋一样，看似复杂的连结操纵，都是有固定轨迹可循的。

比如说连过去的页面，很刚好都是赚钱的关键字页面，比如说常常短时间内涌入大量连结……对AI 来说，只要读懂对方的「呼吸」，并且扰乱对方的「呼吸节奏」就能胜出。

Google宣称，它现在不用再投入大量人力审核、惩罚了。

只要被AI 辨识到有「作弊」的轨迹，那么这些连结造成的不当排名效果，就会被即时抹除。

真正的机制：信任

搜寻引擎和「优化师」共同追求的极致是「信任」。只要你写的内容够屌、能和《维基百科》拼搏，大家就会愿意插入连结、介绍他的读者到你的页面，因为引用你的意见就是引用专家意见。把你写的好书分享给我的朋友，同时象征了我很有学问。

说穿了，能够永久提升排名的机制，就是同样的核心原则─创作编辑认可。没通过这个标准的，就不算高品质的引用连结。

当你在写文章的时候，你会参考维基百科、会翻找知名媒体新闻网，身为创作者的你，会「自愿」插入连结引用好的资讯。但你几乎不会去挖掘某个不知名的小作家，用连结指向他的论述。

因为你会愿意引用的，是高权威性、高专业度、可信的资料来源。能取得这种连结，对排名的加分效果可说是「霸主」等级。「连结」影响搜寻引擎的程度，就如同武林当中的至尊：得连结者，得天下。

知道连结的重要性，就先赢一半。

有太多杂七杂八的「SEO 优化因素」，但就算它们全部叠加在一起，只要对上高品质连结，效果可以说是不堪一击。谁搜集到最多编辑认可的连结，谁就是权威、谁就能享有顶级的排名表现。

只是，「连结」通常被严重低估，因为它的构成逻辑相当复杂。但从科学实证来看，连结对排名表现来说，有确实显著的统计意义。如果关键字排名是一场考试，「连结」就像是试卷背后配分超高、难度也高的题型。

在这场考试里面，大部分的考生都没发现后面还有题目，你「知道」连结这件事，就赢在起跑点上了。