真・懒

订阅 Twitter GitHub 联系

「写好文章」,SEO 成功一半

HTML 诞生于学术机构,最初的动机很单纯,只是提供一个人人可学人人可用的一套标记或者创建文档的方法。最初的 HTML 很简单,足于应付常规的学术文档的编排(当然,它是不能像 TeX 一样排出漂亮的数学公式的),而且那个时代的浏览器基本都是文本浏览器,能区分标题、段落,一切都是那么美好。没错,它是标记(markup)语言。

然而「万恶的」商业终于介入了。光荣(过去式)网景和荣耀的(进行时)微软开始大战了,把裁判 W3C 扔在一旁,荒唐的时候,W3C 还要跟着他们的步伐走,HTML 3.2 就是一个短命的笑话(未考证)。为了一己之私(竞争力?),商业浏览器加入许多非 W3C 的私有的有时候连它老 mu 都不认识的标签,属性等,而且大部分都是表现性的,世界一片混乱。

在混乱中,平面设计师开始转向 Web 设计,WYSIWYG 工具使得他们不需任何思考,甚至连 HTML 是否存在都不知道。完美再现设计,WYSIWYG 工具不知道要浪费多少垃圾代码才能做到。这个时候,HTML 成了表现性语言,没有任何或者很少存在标记的意义了,严重违背了 HTML 的初衷。

这样的害处何在?很明显,HTML 干了它不该干的事情。人类的智慧远胜于机器的智慧,看到一篇网页,我们可以从表现上看到它要表达什么(除非设计不要我们看懂),机器却是没有眼睛的,它看到的是表现背后的一堆源代码,它需要从里面找到源代码所表达的意义,而源代码表达的意义应该跟它的表现展现给人类的意义相同

机器读不懂表现性的代码。比如,font size=7 与一个 h1,机器只知道后一个是这篇网页的标题。

标题?对,老师没告诉过你写作文要写标题吗?老师在讲你有没有在听?有没有有没有……没有嘛~

哦,是我不好,我应该提前说明我的观点:写 HTML 就像写好一片文章,基本功在于合理地组织内容,大标题,二级、三级、四级标题,分好段落,列表,画数据表格等等。整个 HTML 规范就是要教你怎么从结构上写好文章,要不怎么能叫标记语言(markup language)呢。世界上本来不存在 Web 标准(web standards)之说,但人们已经忘掉了 HTML 本来的意义,某些组织(Web Standards Project)不得不用某些看起来很重量级的词汇(Web Standards)来呼吁设计者/开发者重新认识 HTML。

关搜索引擎优化什么事?事关重大。搜索引擎如何工作?搜索引擎每天派出蜘蛛(spider. 对,它们都是机器)到处游荡,试图把世界上存在的,它能进去的网页都扒出来,然后交给数据库索引,搜索引擎就可以根据人们的需要捡出数据。在一定程度上,蜘蛛的优劣也决定了搜索引擎的优劣。但无论如何优秀的蜘蛛,它们都喜欢 Web 标准,就像你的老师,她/他也喜欢格式良好的作文。如果您的 HTML 里面充斥了表现性的内容,到处都是 table,本来该属于段落或者列表的内容适用使用 br 粗暴地打断,那么,蜘蛛就会很吃力地去试图理解这篇网页到底要表达什么,前面说到,它不是人类,它仅能通过某种固有的被人类定义好的方式去行事,它是瞎子,它看不到网页上的表现,这对它毫无意义,它只希望能从里面找到某些结构,让它知道这篇网页所要传达的意义。如果你不是很喜欢你的老师,你可以写一篇没有标点符号的作文给你老师看,让她/他感受一下这些机器才能感受到的痛苦……

可见,Web 标准本身就是要我们「写好文章」,但似乎没有多少人真正注意这个,每天沉浸在各种 CSS 奇技淫巧中不能自拔(呵呵,有点离题)。HTML 标签并不多,但已经基本够用。在「下笔」之前,我们是不是该先考虑用该标签是不是能准确传达本来所要表达的意思,还有没有更好的来取代它,或者说用它压根就是一种错误?人类可以无所谓表现后面的源代码,但机器不可无所谓,你做的事情,不仅要让人类看懂,也要能让机器看懂。

机器看得懂,那么,你的 SEO 已经成功了一半。另一半在哪?兄弟,交钱去吧 XD ……

推荐阅读:SEO 基础,十分有用。